spark作业调度
2015-09-21 15:57
295 查看
DAG Scheduler
1、根据DAG将stages拆分为多个Task,组成一个TaskSet,决定每个任务的最佳位置,也就是具体需要操作的数据在哪里;
2、记录哪个RDD或者Stage输出被物化,也就是catch之类的操作;
3、将taskset(每一个stage就是一个taskset)传给底层调度器TaskScheduler;
4、重新提交shuffle输出丢失的stage,stage内部的错误他是不管的;
Task Scheduler
1、提交taskset(就是一组task)到集群运⾏行并汇报结果;
2、出现shuffle输出lost要报告fetch failed错误;
3、碰到straggle任务需要放到别的节点上重试;
4、为每⼀一个TaskSet维护⼀一个TaskSetManager(追踪本地性及错误信息);
相关文章推荐
- @property
- Java中如何实现时间的加减
- Torch基础学习(一)
- Boost和标准库中正则表达式的使用
- sql去重查询
- hdu 1257 最少拦截系统 (贪心)
- 添加的千分的分隔符
- Tomcat下部署多个项目
- ocp-v13-683
- 添加千分的分隔符
- git 命令学习及更新
- 提高网页性能的九大技巧
- JAVA自带监控工具的介绍
- NET编程简易生成用友财务软件的财务接口数据
- Spring with Hibernate persistence and transactions example
- Android中常见的像素单位
- ubuntu 环境变量改错导致所有命令用不了
- 单例模式的七种写法
- android获取系统wifi状态等
- 解决ubuntu 14.04删ibus导致系统设置项目的损失后,,退出关机问题是不正常的