您的位置:首页 > 数据库

如何在E-MapReduce上提交Storm作业处理Kafka数据

2018-02-11 17:29 405 查看
点击有惊喜


0. 序言

本文演示如何在E-MapReduce上部署Storm集群和Kafka集群,并运行Storm作业消费Kafka数据。


1. 准备环境

这里我选择在杭州Region进行测试,版本选择EMR-3.8.0,本次测试需要的组件版本有:
Kafka:2.11_1.0.0
Storm: 1.0.1

E-MapReduce的集群管理界面地址:https://emr.console.aliyun.com/console#/cn-hangzhou/


1.1 创建Hadoop集群

由于Zookeeper和Storm组件默认不是必选的,所以在创建集群时需要记得勾选上,如下:



详细创建集群步骤,请参考E-MapReduce-用户指南-集群一节。


1.2 创建Kafka集群

接着创建Kafka集群,集群类型选择Kafka,如下:



注意:
如果使用经典网络,请注意将Hadoop集群和Kafka集群放置在同一个安全组下面,这样可以省去配置安全组,避免网络不通的问题。
如果使用VPC网络,请注意将Hadoop集群和Kafka集群放置在同一个VPC/VSwitch以及安全组下面,这样同样省去配置网路和安全组,避免网络不通。
如果你熟悉ECS的网络和安全组,可以按需配置。

点击有惊喜

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数据库
相关文章推荐