统计 YARN 提交任务的Hostname 分布
2015-07-06 17:44
357 查看
1、介绍:
做集群规划的时候,有一点非常必要的就是一定要知道都是哪些机器在向yarn提交任务,这样如果需要做配置上的调整,可以进行统计调整。另外也可以很清楚的知道是哪些业务在使用hadoop 计算数据。
最简单的统计方法就是获取所有(或某一天)所有的任务,然后拿出它们的submithostname,之后简单统计即可。
2、统计代码
3、执行
4、结果(参考)
slave111,24
slave22, 96
零宽断言的参考:http://deerchao.net/tutorials/regex/regex.htm#lookaround
做集群规划的时候,有一点非常必要的就是一定要知道都是哪些机器在向yarn提交任务,这样如果需要做配置上的调整,可以进行统计调整。另外也可以很清楚的知道是哪些业务在使用hadoop 计算数据。
最简单的统计方法就是获取所有(或某一天)所有的任务,然后拿出它们的submithostname,之后简单统计即可。
2、统计代码
#!/bin/bash if [ ! -n "$1" ];then theday=`date -d "-0 day" "+%Y %m %d" ` else theday=$1 #输入参考 countSubmit.sh "2015 07 01" fi read year month day << DATE_COMMAND $theday DATE_COMMAND echo $year $month $day INPUT="/user/history/done/$year/$month/$day/*/*.xml" # for i in `hadoop fs -ls $INPUT | head | awk '{print $8}'` do echo `hadoop fs -cat $i | grep submithostname | grep -oP '(?<=<value>)[^<]*' ` #零宽断言 done
3、执行
sh countSubmit.sh |awk '{a[$1]++}END{for (j in a) print j","a[j]}'
4、结果(参考)
slave111,24
slave22, 96
零宽断言的参考:http://deerchao.net/tutorials/regex/regex.htm#lookaround
相关文章推荐
- Selenium_WebDriver下拉框练习_Java
- Unreal Engine 4 一些小技巧或提示
- 多目标进化问题,根据PCI进行小区的聚类,Kmeans算法的改进:二次聚类
- 六、数组及输入方式
- 安装Redis完整过程
- Mongodb for Mac 安装
- Django模块笔记【五】
- 判断内核
- Oracle之 数据分页查询
- mysql学9-优化
- spark学习笔记总结-spark入门资料精化
- 做一个带时分秒的extjs 日期控件扩展
- 黑马程序员- 反射
- mysql学习8--日志
- Mac下添加java环境变量
- You must first run the Installation Wizard before running this setup
- 生成支持32位和64位静态库
- **redis密码管理
- hibernate createQuerySql 映射问题
- SparkR跑通的函数(持续更新中...)