Hive高级优化
2018-03-14 14:12
295 查看
并发执行
job1: a join b aa
job2: c join d cc
job3: aa join cc
说明:job1和job2可以并行执行。
JVM重用
它是对map/reduce 运行的任务,一个jvm可以运行多个map 任务。小数据可以使用jvm重用。性能可以提升70%我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。
Reduce的数据
默认reduce的任务是一个,可以根据自己的业务进行手动调整,不断测试把它调节到一个合适的值。
推测执行
说明:MapReduce调优,默认启用的,最后把它关闭掉,这只为false。场景:运行reduce时,有的慢,有的快,applicationMaster在另外一个机器上启动一个一模一样的reduce,那个先完成用那个。
Map数据
原文链接
相关文章推荐
- HIVE高级与企业优化
- hive性能优化指南——高级篇
- Hive高级进阶与优化
- Hadoop Hive概念学习系列之hive里的优化和高级功能(十四)
- 深入理解Java虚拟机JVM高级特性与最佳实践阅读总结—— 第十三章 线程安全与锁优化
- Hive原理及查询优化
- hive优化之自动合并输出的小文件
- Hive SQL优化之 Count Distinct
- hive优化之开启压缩功能
- hive的查询注意事项以及优化总结
- Hive 查询优化总结
- hive的查询注意事项以及优化总结 .
- map和reduce 个数的设定 (Hive优化)经典
- map和reduce 个数的设定 (Hive优化)经典
- Hive 分区优化以及jon 优化
- mysql高级操作(优化)
- hive 优化的原则
- Hive优化---map端连接
- Hive优化
- Hive MapJoin 优化