Hadoop-4
2015-11-10 09:32
465 查看
Counter
计数器: 1.mapreduce任务计数器:TaskCounter 2.文件系统计数器:FileSystemCounter 3.输入文件计数器:FileInputFormatCounter 4.输出文件计数器:FileOutputFormatCounter 5.任务计数器:JobCounter 自定义计数器: 6.Context中可以获取一个Counter,再根据Counter的increamen(long ) context.getCounter(MyCounter.SIMA).increament(2); 7.动态添加计数器: 使用Context的getCounter(String groupName,String counterName) 8.获取counter的值. Counters counter = RunningJob.getCounters(); counter.find("groupName","helloword")//获取自定义的counter
排序
二次排序:对Map的结果进行排序处理,需要继承WritableComparator,需要一个无参的构造函数。
public SecondSort(){super(MyDataType.class,true)},其中MyDataType是需要进行
比较的数据类型。使用方法:
job.setSortComparatorClass(SecondSort.class)
结果分组:对Reducer的输出结果进行分组处理。也需要继承
WritableComparator以及一个无参的构造函数。
public ResultSort(){super(MyDataType.class,true)},MyDataType也是需要进行分组的数据
类型。使用方法:
job.setGroupingComparatorClass(ResultSort.class)
相关文章推荐
- <摘录>CentOS6.5下添加epel源
- 用Photoshop生成的图片,使用IE8以下的浏览器打开不了
- 《NOX: Towards an Operating System for Networks》总结
- linux基础学习笔记
- 如何在Linux下使用Gitblit工具创建Git仓库服务
- 如何在Linux下使用Gitblit工具创建Git仓库服务
- 如何在Linux下使用Gitblit工具创建Git仓库服务
- Pixel
- linux sudo 命令
- Ubuntu 14.04 Apache2 支持中文文件名
- 浅谈软件性能测试中关键指标的监控与分析
- linux设置服务开机自启动的三种方式
- Linux如何设置服务自启动
- openCV坐标系与row&col的关系 (Mat::at(x,y)和Mat::at(Point(x, y))的区别)
- VC2005从开发MFC ActiveX ocx控件到发布到.net网站的全部过程
- Compare two ints without using comparison operators
- OpenGL ES 3.0之Texturing纹理详解(二)
- 十大流行Linux发行版
- Linux虚拟地址空间布局
- Linux安装开发环境,必须配置的环节(Fedora15版本)