yarn-site.xml相关配置参数
2016-11-22 09:26
519 查看
机器总共16G内存,sqoop导入数据时大约需要2G左右mapred-site.xml
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>mapreduce.jobhistory.address</name> <value>master:10020</value> <description>MapReduce JobHistory Server IPC host:port</description> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>master:19888</value> <description>MapReduce JobHistory Server Web UI host:port</description> </property> <property> <name>mapred.child.java.opts</name> <value>-Xmx3000m -Xmx3000m -XX:-UseGCOverheadLimit</value> </property> <property> <name>mapreduce.reduce.memory.mb</name> <value>4096</value> </property> <property> <name>mapreduce.map.memory.mb</name> <value>4096</value> </property> <property> <name>mapreduce.task.timeout</name> <value>600000</value> </property> </configuration>yarn-site.xml
<configuration> <property> <name>yarn.resourcemanager.hostname</name> <value>master</value> </property> <property> <description>The address of the applications manager interface in the RM.</description> <name>yarn.resourcemanager.address</name> <value>${yarn.resourcemanager.hostname}:8032</value> </property> <property> <description>The address of the scheduler interface.</description> <name>yarn.resourcemanager.scheduler.address</name> <value>${yarn.resourcemanager.hostname}:8030</value> </property> <property> <description>The http address of the RM web application.</description> <name>yarn.resourcemanager.webapp.address</name> <value>${yarn.resourcemanager.hostname}:8088</value> </property> <property> <description>The https adddress of the RM web application.</description> <name>yarn.resourcemanager.webapp.https.address</name> <value>${yarn.resourcemanager.hostname}:8090</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address</name> <value>${yarn.resourcemanager.hostname}:8031</value> </property> <property> <description>The address of the RM admin interface.</description> <name>yarn.resourcemanager.admin.address</name> <value>${yarn.resourcemanager.hostname}:8033</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.scheduler.maximum-allocation-mb</name> <value>9216</value> <discription>每个节点可用内存,单位MB,默认8182MB</discription> </property> <property> <name>yarn.nodemanager.vmem-pmem-ratio</name> <value>2.1</value> </property> <property> <name>yarn.nodemanager.resource.memory-mb</name> <value>10240</value> </property> </configuration>
ResourceManager相关配置参数
(1) yarn.resourcemanager.address参数解释:ResourceManager 对客户端暴露的地址。客户端通过该地址向RM提交应用程序,杀死应用程序等。默认值:${yarn.resourcemanager.hostname}:8032(2) yarn.resourcemanager.scheduler.address参数解释:ResourceManager 对ApplicationMaster暴露的访问地址。ApplicationMaster通过该地址向RM申请资源、释放资源等。默认值:${yarn.resourcemanager.hostname}:8030(3) yarn.resourcemanager.resource-tracker.address参数解释:ResourceManager 对NodeManager暴露的地址.。NodeManager通过该地址向RM汇报心跳,领取任务等。默认值:${yarn.resourcemanager.hostname}:8031(4) yarn.resourcemanager.admin.address参数解释:ResourceManager 对管理员暴露的访问地址。管理员通过该地址向RM发送管理命令等。默认值:${yarn.resourcemanager.hostname}:8033(5) yarn.resourcemanager.webapp.address参数解释:ResourceManager对外web ui地址。用户可通过该地址在浏览器中查看集群各类信息。默认值:${yarn.resourcemanager.hostname}:8088(6) yarn.resourcemanager.scheduler.class参数解释:启用的资源调度器主类。目前可用的有FIFO、Capacity Scheduler和Fair Scheduler。默认值:org.apache.Hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler(7) yarn.resourcemanager.resource-tracker.client.thread-count参数解释:处理来自NodeManager的RPC请求的Handler数目。默认值:50(8) yarn.resourcemanager.scheduler.client.thread-count参数解释:处理来自ApplicationMaster的RPC请求的Handler数目。默认值:50(9) yarn.scheduler.minimum-allocation-mb/ yarn.scheduler.maximum-allocation-mb参数解释:单个可申请的最小/最大内存资源量。比如设置为1024和3072,则运行MapRedce作业时,每个Task最少可申请1024MB内存,最多可申请3072MB内存。默认值:1024/8192(10) yarn.scheduler.minimum-allocation-vcores / yarn.scheduler.maximum-allocation-vcores参数解释:单个可申请的最小/最大虚拟CPU个数。比如设置为1和4,则运行MapRedce作业时,每个Task最少可申请1个虚拟CPU,最多可申请4个虚拟CPU。什么是虚拟CPU,可阅读我的这篇文章:“YARN 资源调度器剖析”。默认值:1/32(11) yarn.resourcemanager.nodes.include-path /yarn.resourcemanager.nodes.exclude-path参数解释:NodeManager黑白名单。如果发现若干个NodeManager存在问题,比如故障率很高,任务运行失败率高,则可以将之加入黑名单中。注意,这两个配置参数可以动态生效。(调用一个refresh命令即可)默认值:“”(12) yarn.resourcemanager.nodemanagers.heartbeat-interval-ms参数解释:NodeManager心跳间隔默认值:1000(毫秒)2. NodeManager相关配置参数
(1) yarn.nodemanager.resource.memory-mb参数解释:NodeManager总的可用物理内存。注意,该参数是不可修改的,一旦设置,整个运行过程中不可动态修改。另外,该参数的默认值是8192MB,即使你的机器内存不够8192MB,YARN也会按照这些内存来使用(傻不傻?),因此,这个值通过一定要配置。不过,Apache已经正在尝试将该参数做成可动态修改的。默认值:8192(2) yarn.nodemanager.vmem-pmem-ratio参数解释:每使用1MB物理内存,最多可用的虚拟内存数。默认值:2.1(3) yarn.nodemanager.resource.cpu-vcores参数解释:NodeManager总的可用虚拟CPU个数。默认值:8(4) yarn.nodemanager.local-dirs参数解释:中间结果存放位置,类似于1.0中的mapred.local.dir。注意,这个参数通常会配置多个目录,已分摊磁盘IO负载。默认值:${hadoop.tmp.dir}/nm-local-dir(5) yarn.nodemanager.log-dirs参数解释:日志存放地址(可配置多个目录)。默认值:${yarn.log.dir}/userlogs(6) yarn.nodemanager.log.retain-seconds参数解释:NodeManager上日志最多存放时间(不启用日志聚集功能时有效)。默认值:10800(3小时)(7) yarn.nodemanager.aux-services参数解释:NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行MapReduce程序相关文章推荐
- yarn-site.xml相关配置参数
- yarn-site.xml相关配置参数
- yarn-site.xml相关配置参数列表说明
- Hadoop配置文件参数整理(4)---yarn-site.xml
- yarn-site.xml配置参数
- Hadoop配置文件参数整理(1)---core-site.xml
- hadoop三个配置文件的参数含义说明core-site.xml、hdfs-site.xml、mapred-site.xml
- YARN日志聚合相关参数配置
- Hadoop YARN配置参数剖析(3)—MapReduce相关参数
- yarn-site.xml and mapred-site.xml 配置以及属性说明
- Hadoop配置文件参数整理(3)---mapred-site.xml
- Hadoop YARN配置参数剖析(1)—RM与NM相关参数
- hadoop配置 - 1.x core-site.xml 参数设定
- hadoop配置 - 1.x mapred-site.xml 参数设定
- 关于web.xml里相关配置参数的作用及使用
- hadoop三个配置文件的参数含义说明core-site.xml,hdfs-site.xml,mapred-site.xml
- hadoop 2.2.X 配置参数说明:hbase-site.xml
- hadoop 2.2.X 配置参数说明:mapred-site.xml
- Hadoop YARN配置参数剖析(1)—RM与NM相关参数
- Yarn 内存分配管理机制及相关参数配置