您的位置:首页 > 其它

Hive高级优化

2018-03-14 14:12 295 查看


并发执行



job1: a join b aa

job2: c join d cc
job3: aa join cc
说明:job1和job2可以并行执行。


JVM重用

它是对map/reduce 运行的任务,一个jvm可以运行多个map 任务。小数据可以使用jvm重用。性能可以提升70%

我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。




Reduce的数据

默认reduce的任务是一个,可以根据自己的业务进行手动调整,不断测试把它调节到一个合适的值。




推测执行

说明:MapReduce调优,默认启用的,最后把它关闭掉,这只为false。
场景:运行reduce时,有的慢,有的快,applicationMaster在另外一个机器上启动一个一模一样的reduce,那个先完成用那个。




Map数据

原文链接
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: