YARN - 比较 YARN 与 MapReduce 1
2016-12-03 10:46
162 查看
比较 YARN 与 MapReduce 1
主要区别就是 YARN 把 MR1 中的 Jobtracker 的职责分给了其他三个组件。分而治之,减少组件间的强耦合,会得到许多的好处。YARN 与 MapReduce 1 对应组件
MapReduce | YARN |
---|---|
Jobtracker | Resource manager, application master, timeline server |
Tasktracker | Node manager |
Slot | Container |
使用 YARN 的好处
扩展性好
YARN 能够运行在比 MR1 更大的集群上。 MR1 的上限是 4000 节点 与 40000 个 task。而 YARN 的上限是 10000 个节点与 100000 个 task。高可用性
在 MR1 中,job 的复杂的状态的改变都发生在 jobtracker 中的内存中,一旦 jobtracker 坏了,就很难再恢复。而在 YARN 里,jobtracker 的职责分给了 resource manager 和 application master。这样可以为两个组件分别提供高可用。对每个组件发生的错误分别处理,互相不影响。
资源利用率高
在 MR1 中, 每一个 tasktracker 在配置阶段会固定的为 map 或者 reduce task 静态的分配资源,也就是 “槽”。因为每个应用程序所需要的资源并不是完全一样,这样有时会造成资源分配过大,资源浪费,资源分配过小,会导致任务失败。在 YARN 中,资源由 resource manager 管理,应用程序会请求他所需要的资源。
多应用
YARN 中最大的好处就是可以在其上开启除 Mapreduce 之外的分布式应用程序,比如 Spark。也可能为用户在一个 YARN 上运行不同版本的 MapReduce。
End!!
相关文章推荐
- Mapreduce 运行原理(针对使用YARN作为调度和管理的
- Hadoop 新 MapReduce 框架 Yarn 详解
- yarn hadoop mapreduce 2.0 编译
- yarn & mapreduce 配置参数总结
- mongo数据库 mapreduce 与 group 效率比较
- Hadoop 新 MapReduce 框架 Yarn 详解
- 客户端MapReduce提交到YARN过程
- Hadoop 新 MapReduce 框架 Yarn 详解
- 运行在YARN上的MapReduce应用程序(以MapReduce为例)
- hadoop使用yarn运行mapreduce的过程
- hadoop2.2.0安装中遇到的错误:mapreduce.shuffle set in yarn.nodemanager.aux-services is invalid
- YARN调度策略比较
- MapReduce的yarn框架整理
- hadoop2.2.0安装中遇到的错误:mapreduce.shuffle set in yarn.nodemanager.aux-services is invalid
- org.apache.hadoop.yarn.exceptions.InvalidAuxServiceException: The auxService: mapreduce_shuffle do
- Hadoop 新 MapReduce 框架 Yarn 详解【转载】
- Hadoop之yarn和mapreduce
- Apache Hadoop NextGen MapReduce (YARN)
- Hadoop 新 MapReduce 框架 Yarn 详解
- hadoop里面的MapReduce和yarn的运行原理