SparkStreaming的运行流程
2017-11-22 14:11
232 查看
运行流程:
1、我们在集群中的其中一台机器上提交我们的Application Jar,然后就会产生一个Application,开启一个Driver,然后初始化SparkStreaming的程序入口StreamingContext;
2、Master会为这个Application的运行分配资源,在集群中的一台或者多台Worker上面开启Excuter,executer会向Driver注册;
3、Driver服务器会发送多个receiver给开启的excuter,(receiver是一个接收器,是用来接收消息的,在excuter里面运行的时候,其实就相当于一个task任务)
4、receiver接收到数据后,每隔200ms就生成一个block块,就是一个rdd的分区,然后这些block块就存储在executer里面,block块的存储级别是Memory_And_Disk_2;
5、receiver产生了这些block块后会把这些block块的信息发送给StreamingContext;
6、StreamingContext接收到这些数据后,会根据一定的规则将这些产生的block块定义成一个rdd;
相关文章推荐
- SparkStreaming的运行流程解析(源码)
- SparkStreaming的运行流程解析(源码)
- 第2课:通过案例对SparkStreaming透彻理解三板斧之二:解密SparkStreaming运行机制和架构
- 第3课:通过案例对SparkStreaming 透彻理解三板斧之三:解密SparkStreaming运行机制和架构进阶之Job和容错
- 通过案例对SparkStreaming 透彻理解三板斧之三:解密SparkStreaming运行机制和架构进阶之Job和容错
- 第5课:基于案例一节课贯通Spark Streaming流计算框架的运行源码
- 第5课:基于案例一节课贯通Spark Streaming流计算框架的运行源码
- Spark Client和Cluster两种运行模式的工作流程
- 第5课:基于案例一节课贯通Spark Streaming流计算框架的运行源码
- Spark streaming 执行流程源码图
- Spark系统运行内幕机制循环流程
- spark运行流程
- 解密SparkStreaming运行机制和架构进阶之Job
- 【异常】SparkStreaming长时间运行出现: Dropping SparkListenerEvent because no remaining room in event queue
- Spark Streaming 执行流程
- 第35课:Spark系统运行内幕机制循环流程
- Spark提交作业的流程以及作业是如何被触发在集群中运行的
- 谈谈如何优雅的关闭正在运行中的Spark Streaming的流程序
- 基于Flume+Kafka+Spark-Streaming的实时流式处理完整流程
- 通过案例对SparkStreaming 透彻理解三板斧之一:解密SparkStreaming运行机制