您的位置:首页 > 运维架构

Hadoop Combiner 使用问题

2015-04-04 06:55 267 查看
本想通过combiner减少输入到reduce的数据,但是使用过程中总发生问题。

后来看权威指南,才知道,combiner是会反复调用的,即可能两个combiner一次后,将结果再传给一个combiner;

所以写combiner一定要输入和输出格式相同,并不是同reducer相同就可以,reducer的输入和输出格式是未必相同的。

mapper1 -> combiner1

mapper2-> combiner2

combiner1,combiner2 -> combiner3

combiner3 - >reducer1
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: