mapreduce程序在yarn上运行的流程
2017-10-30 23:25
274 查看
自己学习mapreduce的一点简单的心得
1.当我们在准备在yarn上运行一个mapreduce程序时,job.waitForCompletion()就会去Resource Manager发出一个请求,请求运行一个m r程序;
2.hdfs在获得这个请求之后,会去分配一个jobid和一个job资源提交的路径;
3.接下来就是准备向HDFS提交所需要的资源,分别是所需要的jar包以及计算切片后得到的切片信息的list信息;
4.准备好资源后,告知R M,向其申请一个容器来运行MRAPPMaster进程;
5.MRAPPMaster在得到请求后,会发布一个创建相应容器的任务,告诉相应的nodemanager,让其创建相应的容器;
6.创建好容器之后,nodemanager会去HDFS上下载启动MRAPPMaster需要的程序文件;
7.程序文件准备好之后,hdfs会发送一个启动MRAPPMaster的shell命令,然后预先创建了MRAPPMaster容器的nodemanager会执行这个shell命令;
8.此时,MRAPPMaster会去想R M请求申请若干容器用来给相应的nodemanager来启动相应的yarnchild,这里容器的数量取决于切片数量以及reducetask来决定;
9.接下来,相应的nodemanager就会去创建相应的容器来准备启动yarnchild程序;
10.MRAPPMaster发送启动yarnchild程序的shell命令,相应准备好容器的nodemanager就会执行shell命令启动yarnchild;
11.待到最后一个reducetask运行完毕之后,MRAPPMaster会向Resource Manager汇报job运行完毕并且退出。资源会被nodemanager回收。
下面有详细图解 ,只是小白的个人理解,如有不对之处,敬请赐教。
相关文章推荐
- HDFS设计思路,HDFS使用,查看集群状态,HDFS,HDFS上传文件,HDFS下载文件,yarn web管理界面信息查看,运行一个mapreduce程序,mapreduce的demo
- MapReduce在YARN上的运行流程
- 【学习笔记】用Hadoop在MapReduce中WordCount简单程序运行详细流程
- MapReduce程序运行流程
- HDFS设计思路,HDFS使用,查看集群状态,HDFS,HDFS上传文件,HDFS下载文件,yarn web管理界面信息查看,运行一个mapreduce程序,mapreduce的demo
- Hadoop 2.x环境搭建之三配置部署启动YARN及在YARN上运行MapReduce程序
- (3)Hadoop 配置部署启动YARN及在YARN上运行MapReduce程序
- MapReduce程序运行流程
- spark on yarn(Job的运行流程,可以对比mapreduce的yarn运行)
- Hadoop环境搭建三之配置部署启动YARN以及在YARN上运行MapReduce程序
- 简单解析PHP程序的运行流程
- Windows下使用eclipse插件运行自己的MapReduce程序
- Hadoop学习全程记录——在Eclipse中运行第一个MapReduce程序
- 使用命令行编译打包运行自己的MapReduce程序 hadoop2.7.3
- MapReduce 编程 系列四 MapReduce例子程序运行
- 如何在Windows中运行MapReduce程序
- MapReduce开发程序,运行环境配置
- MapReduce程序的3种集群提交运行模式详解---基于Windows与Linux两种开发环境
- MapReduce程序单机版运行所需的配置
- AWS EMR运行MAPREDUCE程序-WORDCOUNT