您的位置:首页 > 其它

spark on yarn 两种运行模式(client 、cluster)对比

2017-04-17 17:36 946 查看

机器:

master1 : ResourceManager Master

node2 : NodeManager Worker

node3: NodeManager Worker

node4: NodeManager Worker

此时同时开启了 Yarn 和 Spark Standalone

Spark on Yarn 模式不需要打开Spark集群.

图片



点击查看原图

对比(文字):

模式提交模式driver(main方法,用户程序)ApplicationMasterResourceManagerNodeManagerMasterWorkerContainerExecutor
standalone–master spark://master1:7077在Master上在Master上用户程序通过与Master节点交互,申请所需资源Worker节点负责具体Executor的启动运行运行在Work上,里面运行Task上,CoarseGrainedExecutorBackend进程
spark on yarn(client)–master yarn –deploy-mode clientdriver运行在提交作业的机器上(可以看到程序打印日志)运行在某一台机器上,向RM申请资源(container),杀死任务管理资源,接受任务根据RM命令,分配containerContainer里面运行着Spark Executor运行在Container里里面运行Task
spark on yarn(cluster)–master yarn –deploy-mode clusterdriver运行在集群上某个机器上(看不到日志,只可以看到running状态),Driver在AppMaster执行运行在集群某一台机器上,申请资源(container),杀死任务.管理资源,接受任务根据RM命令,分配containerContainer里面运行着Spark Executor运行在Container里,里面运行Task
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  spark yarn