hadoop任务优化-调整队列资源
2015-09-24 19:27
337 查看
集群环境: chd5-2.5.2
我们集群使用的是FailScheduler,如果队列参数设置不合理,会直接影响到任务执行的快慢。
队列设置不合理
举例如下:
现状:该队里minshare设置的过小,同时起的任务太多
导致的问题:该队列中平均每个任务分的资源比较少,任务跑的特别慢,同时,任务之间会相互抢占container
比如下面的任务,跑了30多个小时,还没跑完
看一下任务详情:
1,当前只分配了11个container,还差约4000个cotnainer才能完成任务,
2,container被kill掉了约16000个,资源浪费严重
container 被kill掉的原因,大部分是因为container被别的任务抢占。:
解决办法:
1)调整minshare,maxshare
2)调整maxrunningapp
参数的详细解释,可以参考
http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-fair-scheduler/
我们集群使用的是FailScheduler,如果队列参数设置不合理,会直接影响到任务执行的快慢。
队列设置不合理
举例如下:
现状:该队里minshare设置的过小,同时起的任务太多
导致的问题:该队列中平均每个任务分的资源比较少,任务跑的特别慢,同时,任务之间会相互抢占container
比如下面的任务,跑了30多个小时,还没跑完
看一下任务详情:
1,当前只分配了11个container,还差约4000个cotnainer才能完成任务,
2,container被kill掉了约16000个,资源浪费严重
container 被kill掉的原因,大部分是因为container被别的任务抢占。:
解决办法:
1)调整minshare,maxshare
2)调整maxrunningapp
参数的详细解释,可以参考
http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-fair-scheduler/
相关文章推荐
- nginx反向代理与负载均衡
- hadoop在put数据时,出现org.apache.hadoop.hdfs.server.namenode.NotReplicatedYetException 分析
- 我的linux学习笔记
- 从零开始搭建高可用IM系统
- 关于参加OpenBLAS介绍会的一些心得
- Linux开机过程的分析(关于bootsect.S)
- shell脚本编程-检查和测试
- Shell
- CentOS -简单shell
- OpenCV3.0基本类型初探(一)
- shell split
- 【详解】回车 换行 0X0D 0X0A CR LF \R \N WIN LINUX MAC系统
- tomcat catalina.bat解读
- CentOS-6.5-x86_64 最小化安装,已安装包的总数,这些包?
- nginx 配置--限定用户访问,防止非80端口转80技巧
- CentOS7下Python开发环境搭建
- Openstack 快速入门(官方文档直译)
- Linux内核是如何启动android内核直到我们的helloword
- Linux下MySQL不能被远程访问
- LINUX信息安全系统设计基础第二周学习总结