您的位置：首页 > 运维架构

Hadoop-4

2015-11-10 09:32 465 查看

Counter

计数器:
1.mapreduce任务计数器:TaskCounter
2.文件系统计数器:FileSystemCounter
3.输入文件计数器:FileInputFormatCounter
4.输出文件计数器:FileOutputFormatCounter
5.任务计数器:JobCounter
自定义计数器:
6.Context中可以获取一个Counter,再根据Counter的increamen(long )
context.getCounter(MyCounter.SIMA).increament(2);
7.动态添加计数器:
使用Context的getCounter(String groupName,String counterName)
8.获取counter的值.
Counters counter = RunningJob.getCounters();
counter.find("groupName","helloword")//获取自定义的counter

排序

二次排序：对Map的结果进行排序处理，需要继承

WritableComparator

，需要一个无参的构造函数。

public SecondSort(){super(MyDataType.class,true)}

,其中MyDataType是需要进行

比较的数据类型。使用方法：

job.setSortComparatorClass(SecondSort.class)

结果分组：对Reducer的输出结果进行分组处理。也需要继承

WritableComparator

以及一个无参的构造函数。

public ResultSort(){super(MyDataType.class,true)}

,MyDataType也是需要进行分组的数据

类型。使用方法：

job.setGroupingComparatorClass(ResultSort.class)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航