Storm读取Mysql数据库不能加大bolt并行数写入hdfs解决方法
2016-11-17 16:35
274 查看
解决方法:建立一个中间表
spout发射数据给bolt,bolt进行数据清洗,然后插入到一张中间表里面,然后再写一个spout,这个spout不发射数据,每次next时去中间表查看,如果超过预计数据的条数,可以读过来批量插入到hdfs里,一直只有一个spout在写hdfs,或者不写spout,直接写个java程序,每分钟看一次数据库中间表,有数据就写入hdfs。同样,bolt每次被spout或bolt触发时,确实可以去查看中间表,但也存在一个问题,bolt批量去操作中间表插入hdfs会耗时,如果给这个bolt发射的tuple太多,在做批量这个操作时,就会累积大量发射过来的tuple,也会超出队列发生阻塞。中间表可以定时读取数据库时,将数据插入到hdfs,之后把中间表读取的数据都删掉,这样就可以保证了中间表一直就是那么多的数据。bolt自己消费队列数据的速度低于spout插入队列的速度,过一会bolt就会超时。
spout发射数据给bolt,bolt进行数据清洗,然后插入到一张中间表里面,然后再写一个spout,这个spout不发射数据,每次next时去中间表查看,如果超过预计数据的条数,可以读过来批量插入到hdfs里,一直只有一个spout在写hdfs,或者不写spout,直接写个java程序,每分钟看一次数据库中间表,有数据就写入hdfs。同样,bolt每次被spout或bolt触发时,确实可以去查看中间表,但也存在一个问题,bolt批量去操作中间表插入hdfs会耗时,如果给这个bolt发射的tuple太多,在做批量这个操作时,就会累积大量发射过来的tuple,也会超出队列发生阻塞。中间表可以定时读取数据库时,将数据插入到hdfs,之后把中间表读取的数据都删掉,这样就可以保证了中间表一直就是那么多的数据。bolt自己消费队列数据的速度低于spout插入队列的速度,过一会bolt就会超时。
相关文章推荐
- C/C++ 向mysql数据库读取、写入中文的解决方法
- Storm读取Mysql数据库写入hdfs------针对数据量较少的数据
- 写入、读取Mysql数据库时乱码的解决办法:(超有效)
- getHibernateTemplate().save ()成功但不能写入数据库 解决方法
- storm 开发系列三 Clojue编写程序读取kafka数据并写入到hdfs
- unable to read project file....不能读取项目文件的解决方法
- 出现“尝试读取或写入受保护的内存。这通常指示其他内存已损坏”的解决方法
- java读取系统时间写入mysql数据库时,滞后八小时问题的解决
- 关于【finder不能完成该操作 因为未能读取或写入"文件名"中的某些数据(错误代码-36)】快速解决办法
- 尝试读取或写入受保护的内存,这通常指示其他内存已损坏【解决方法】
- 安卓 SD卡写入文件后不能立即显示被写入的文件解决方法
- java读取Mysql数据库写入hdfs
- Hibernate4.1不能读取xml解决方法
- 硬盘分区丢失不能识别,文件系统损坏,不能读取第一个/第二个NTFS引导扇区的解决方法
- php链接mysql数据库不能用localhost的解决方法
- 在AJAX.NET中使用FCKEditor不能读取FCKEditor内容的解决方法
- 【转】安卓 SD卡写入文件后不能立即显示被写入的文件解决方法
- 关于MATLAB2014b不能并行计算的原因及解决方法
- 关于SAS不能读取Excel2007文件的原因及解决方法
- 关于“无法从传输连接中读取数据: 尝试读取或写入受保护的内存。这通常指示其他内存已损坏。”错误的解决方法之一