hadoop内置的计数器分组
2015-09-30 10:13
260 查看
组别 名称、类别
MapReduce任务计数 org.apache.hadoop.mapreduce.TaskCounter
文件系统计数器 org.apache.hadoop.mapreduce.FileSystemCounter
FileInputFormat org.apache.hadoop.mapreduce.lib.input.FileInputFormatCounter
FileOutputFormat org.apache.hadoop.mapreduce.lib.output.FileoututFormatCounter
作业计数器 org.apache.hadoop.mapreduce.JobCounter
=========================================================================================================
内置任务计数器
map输入的记录
map_input_records 作业中所有map已处理的输入记录数,每次RecordReader读到一条记录并将其传递给map的map()函数时,该计数器的值增加
map跳过的记录数
map_skipped_records 作业中所有map跳过的输入记录数
map输入的字节数
map_input_bytes 作业中所有map已处理的未经压缩的输入数据的字节数,每次recordReader读到一条记录并传递给其map的map函数,该计数器的值增加
分片split的原始字节数
split_raw_bytes 由map读取的输入-分片 对象的字节数,这些对象描述分片元数据(文件的位移和长)而不是分片的数据自身,因此总规模是小的。
map输出的记录数
map_output_records
map输出字节数
map_output_bytes
map输出的物化字节数 map_output_materialized_bytes
combine输入的记录数 combine_input_records
combine输出的记录数 comvine_output_records
reduce输入的组 reduce_input_groups
reduce输入的记录数 reduce_input_records
reduce输出的记录数 reduce_output_records
reduce跳过的组数 reduce_skipped_groups
reduce跳过的记录数 reduce_skipped_records
reduce经过shuffle的字节数 reduce_shuffle_bytes
溢出的记录数 spilled_records
cpu毫秒 cpu_milliseconds
物理内存字节数
physical_memeory_bytes
虚拟内存数 virtual_memory_bytes
有效的堆字节数 committed_heap_bytes
GC运行时间毫秒数
GC_TIME_MILLIS
由shuffle传输的map输出数shufled_maps
失败的shuffle数
failed_shuffled
被合并的map输出数
merged_map_outputs
=========================================================================================================
内置的文件系统任务计数器
文件系统的读字节数
bytes_read
文件系统的写字节数
bytes_written
=========================================================================================================
内置的FileInputFormat任务计数器
bytes_read
内置的FileOutputFormat任务计数器
bytes_written
=========================================================================================================
作业计数器
内置的作业计数器
启动的map的任务数 total_launched_maps
启动的reduce任务数 total_launched_reduces
启动的uber任务数 total_launched_ubertasks
uber中的map任务数 num_uber_submaps
uber中的reduce任务数 num_uber_subreduces
失败的map任务数 num_failed_maps
失败的reduce任务数 num_failed_reduces
失败的uber任务数 num_failed_ubertasks
数据本地化的map任务数 data_local_maps
机架本地化的map任务数 rack_local_map
其他本地化的map任务数 other_local_maps
map任务的总运行时间 slots_millis_maps
reduce任务的总运行时间 slots_millis_reduces
hadoop权威指南 page=283
MapReduce任务计数 org.apache.hadoop.mapreduce.TaskCounter
文件系统计数器 org.apache.hadoop.mapreduce.FileSystemCounter
FileInputFormat org.apache.hadoop.mapreduce.lib.input.FileInputFormatCounter
FileOutputFormat org.apache.hadoop.mapreduce.lib.output.FileoututFormatCounter
作业计数器 org.apache.hadoop.mapreduce.JobCounter
=========================================================================================================
内置任务计数器
map输入的记录
map_input_records 作业中所有map已处理的输入记录数,每次RecordReader读到一条记录并将其传递给map的map()函数时,该计数器的值增加
map跳过的记录数
map_skipped_records 作业中所有map跳过的输入记录数
map输入的字节数
map_input_bytes 作业中所有map已处理的未经压缩的输入数据的字节数,每次recordReader读到一条记录并传递给其map的map函数,该计数器的值增加
分片split的原始字节数
split_raw_bytes 由map读取的输入-分片 对象的字节数,这些对象描述分片元数据(文件的位移和长)而不是分片的数据自身,因此总规模是小的。
map输出的记录数
map_output_records
map输出字节数
map_output_bytes
map输出的物化字节数 map_output_materialized_bytes
combine输入的记录数 combine_input_records
combine输出的记录数 comvine_output_records
reduce输入的组 reduce_input_groups
reduce输入的记录数 reduce_input_records
reduce输出的记录数 reduce_output_records
reduce跳过的组数 reduce_skipped_groups
reduce跳过的记录数 reduce_skipped_records
reduce经过shuffle的字节数 reduce_shuffle_bytes
溢出的记录数 spilled_records
cpu毫秒 cpu_milliseconds
物理内存字节数
physical_memeory_bytes
虚拟内存数 virtual_memory_bytes
有效的堆字节数 committed_heap_bytes
GC运行时间毫秒数
GC_TIME_MILLIS
由shuffle传输的map输出数shufled_maps
失败的shuffle数
failed_shuffled
被合并的map输出数
merged_map_outputs
=========================================================================================================
内置的文件系统任务计数器
文件系统的读字节数
bytes_read
文件系统的写字节数
bytes_written
=========================================================================================================
内置的FileInputFormat任务计数器
bytes_read
内置的FileOutputFormat任务计数器
bytes_written
=========================================================================================================
作业计数器
内置的作业计数器
启动的map的任务数 total_launched_maps
启动的reduce任务数 total_launched_reduces
启动的uber任务数 total_launched_ubertasks
uber中的map任务数 num_uber_submaps
uber中的reduce任务数 num_uber_subreduces
失败的map任务数 num_failed_maps
失败的reduce任务数 num_failed_reduces
失败的uber任务数 num_failed_ubertasks
数据本地化的map任务数 data_local_maps
机架本地化的map任务数 rack_local_map
其他本地化的map任务数 other_local_maps
map任务的总运行时间 slots_millis_maps
reduce任务的总运行时间 slots_millis_reduces
hadoop权威指南 page=283
相关文章推荐
- Nginx负载均衡 后端服务器怎么共享Session 问题
- svg学习网站
- CentOS命令大全
- linux 中断底半部之tasklet分析
- 在linux服务器上装svn版本管理,自动部署代码到项目
- linux 命令进阶
- Cloning EBS from Linux 5 to Linux 6 Fails: "Error While Loading Shared Libraries: libclntsh.so.10.1
- 新装LINUX系统如何获得ROOT权限,图文教程
- linux(centos6.5)ftp 配置已有用户密码登入:具体文档内容
- jaxb异常 Class has two properties of the same name username
- /var/lock/cinder不存在导致openstack的kilo版本删除云硬盘一直处于deleteing中问题处理。
- 使用Apache Camel处理web service请求的三种方法
- IIS中给网站添加匿名访问用户图文教程
- linux sar 命令详解
- Spark java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCrc32
- openstack导出image镜像的方法
- linux perf - 性能测试和优化工具
- 架构设计:系统间通信(5)——IO通信模型和JAVA实践 下篇
- Linux下SPI测试程序
- Linux下共享库搜索方式