您的位置:首页 > 其它

map reduce解决数据不平衡问题

2017-11-03 16:59 232 查看
hadoop数据不平衡有两种情况

第一种情况是某个NN的数据量很大

可以通过hadoop的balance进行数据平衡,可以多开几个map

第二种情况是某个key的数据很多,reduce过程很慢

可以把key分成多个key进行reduce,然后再进行合并。

https://www.zhihu.com/question/32054214
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: