hive 优化遇到的一个问题:hive.auto.convert.join
2013-11-21 17:29
519 查看
hive的join 有一种优化的方式:map join
但是,使用这种优化的时候要小心一点,先说一下优化配置的参数:
当运行一个比较大的join时候,出现了下面的问题:
https://issues.apache.org/jira/i#browse/HIVE-4502
将 hive.auto.convert.join 设置成false,重新运行,问题就不出现了。
有一篇文件可以看一下:
http://www.gemini5201314.net/hadoop/hadoop-%E4%B8%AD%E7%9A%84%E4%B8%A4%E8%A1%A8join.html
hive 0.11 版的bug 也要注意一下。
但是,使用这种优化的时候要小心一点,先说一下优化配置的参数:
set hive.optimize.correlation=true set hive.auto.convert.join=true
当运行一个比较大的join时候,出现了下面的问题:
at org.apache.hadoop.hive.ql.exec.MapOperator.process(MapOperator.java:671) at org.apache.hadoop.hive.ql.exec.ExecMapper.map(ExecMapper.java:144) ... 8 more Caused by: java.lang.ArrayIndexOutOfBoundsException at java.lang.System.arraycopy(Native Method) at org.apache.hadoop.io.Text.set(Text.java:225) at org.apache.hadoop.hive.serde2.lazybinary.LazyBinaryString.init(LazyBinaryString.java:48) at org.apache.hadoop.hive.serde2.lazybinary.LazyBinaryStruct.uncheckedGetField(LazyBinaryStruct.java:216) at org.apache.hadoop.hive.serde2.lazybinary.LazyBinaryStruct.getField(LazyBinaryStruct.java:197) at org.apache.hadoop.hive.serde2.lazybinary.objectinspector.LazyBinaryStructObjectInspector.getStructFieldData(LazyBinaryStructObjectInspector.java:61) at org.apache.hadoop.hive.ql.exec.ExprNodeColumnEvaluator.evaluate(ExprNodeColumnEvaluator.java:98) at org.apache.hadoop.hive.ql.exec.ReduceSinkOperator.processOp(ReduceSinkOperator.java:234) at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:502) at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:832) at org.apache.hadoop.hive.ql.exec.TableScanOperator.processOp(TableScanOperator.java:90) at org.apache.hadoop.hive.ql.exec.Operator.process(Operator.java:502) at org.apache.hadoop.hive.ql.exec.Operator.forward(Operator.java:832) at org.apache.hadoop.hive.ql.exec.MapOperator.process(MapOperator.java:652) ... 9 more网上查了一圈,貌似这还是个bug:
https://issues.apache.org/jira/i#browse/HIVE-4502
将 hive.auto.convert.join 设置成false,重新运行,问题就不出现了。
有一篇文件可以看一下:
http://www.gemini5201314.net/hadoop/hadoop-%E4%B8%AD%E7%9A%84%E4%B8%A4%E8%A1%A8join.html
hive 0.11 版的bug 也要注意一下。
相关文章推荐
- Hive Tuning(四) 从查询计划看hive.auto.convert.join的好处
- hive: join 遇到问题
- 安装AutoComlPop时遇到的一个问题
- 在Hive中执行DDL之类的SQL语句时遇到的一个问题
- hive 使用lzo遇到的一个奇怪的问题
- 今天代码遇到一个问题以及优化-2016年08月04日19:08:40
- 自己安装cocopods过程遇到问题,菜鸟一个不喜勿喷!
- 遇到的hive问题,fixed in 0.12
- 安装和配置TFS中,遇到的一个小问题
- iphone获取当前运行进程列表遇到一个问题
- TP5路由配置遇到的一个小问题
- Hive笔记--配置以及遇到的问题
- 「解决」spark on yarn上遇到的一个问题
- Swift 改写项目遇到的一个问题
- 遇到一个主明细表的小问题。
- 遇到的Mysql优化问题
- Dynamics CRM2013 Odata的filter中含有日期字段时遇到的一个奇葩问题
- 为SharePoint的多台WFE配置Windows自带的NLB遇到的一个问题
- quickreport报表遇到的一个问题
- 后台服务后台遇到的坑整理,以及做活动的优化经历,redis需要读写分离吗以及其他问题