时间:2021-05-20
Hadoop多Job并行处理的实例详解
有关Hadoop多Job任务并行处理,经过测试,配置如下:
首先做如下配置:
1、修改mapred-site.xml添加调度器配置:
2、添加jar文件地址配置:
Java基本代码如下:
最后将这些代码组装至Main方法,使用Hadoop执行命令运行:
hadoop jar jar包名称 方法入口所在的类
如:
可以通过50030端口来监控Job的并行状态,这里就不多说了!!
解释:
1、配置Jar地址可以解决打包所生成的jar包后,运行时出现ClassNotFound的问题;
2、给多个Job设定setJarByClass,经测试,如果不设定此类,运行时会出现ClassNotFound错误,其中CapuseDateTimerTask为Main方法所在的类名;
3、waitForCompletion与submit方法是有区别的,waitForCompletion是串行,而submit是并行,正是因为submit是并行所以后续的代码操作需要取其执行是否完成的状态来做判断处理即:isComplete();
4、以上Job采用的是:org.apache.hadoop.mapreduce.Job
以上代码操作在单机/集群上测试都通过!
如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
背景:使用java实现jenkins构建很简单,但是如何确定什么时候job已经构建完成才是关键,而且要实现多个job并行构建。分析:我有一篇文章提到过使用jav
详解HDFS多文件Join操作的实例最近在做HDFS文件处理之时,遇到了多文件Join操作,其中包括:AllJoin以及常用的LeftJoin操作,下面是个简单
Hadoop中HBaseShell命令的详解HBase包含可以与HBase进行通信的Shell。HBase使用Hadoop文件系统来存储数据。所有这些任务发生在
详解IOS串行队列与并行队列进行同步或者异步的实例IOS中GCD的队列分为串行队列和并行队列,任务分为同步任务和异步任务,他们的排列组合有四种情况,下面分析这四
我们先来看个实例functionMe(name,age,job){this.name=name;this.age=age;this.job=job;}请问这以下