hive 中order by 与 sort by 的区别
2015-07-03 16:20
302 查看
相信大家在执行Hive语句时要进行排序时总会第一想到order by,我也是!
但每次只要是涉及到order by 都发现MapReduce了好久
今天我尝试了用sort by 代替了order by惊讶地发现MapReduce时间远远比使用order by的时间更短!
以下是具体的
执行了select ip,count(ip) from ip_to_country group by ip order by ip;
发现MapReduce过程如下第一张图
执行了select ip,count(ip) from ip_to_country group by ip sort by ip;
发现MapReduce过程如下第二张图
可以通过观察所花时间看出来!
还有因为在这个过程中每个执行语句都涉及到两个MapReduce任务,所以每张图才会有两个mapreduce过程!
但每次只要是涉及到order by 都发现MapReduce了好久
今天我尝试了用sort by 代替了order by惊讶地发现MapReduce时间远远比使用order by的时间更短!
以下是具体的
执行了select ip,count(ip) from ip_to_country group by ip order by ip;
发现MapReduce过程如下第一张图
执行了select ip,count(ip) from ip_to_country group by ip sort by ip;
发现MapReduce过程如下第二张图
可以通过观察所花时间看出来!
还有因为在这个过程中每个执行语句都涉及到两个MapReduce任务,所以每张图才会有两个mapreduce过程!
相关文章推荐
- Unity编辑器
- CRITICAL keystone [-] OperationalError: (OperationalError) (2003, "Can't connect to MySQL server on
- 黑马程序员—Java面向对象程序设计
- 在html中如何获取表单提交的数据
- 宫锁心玉--经典语句
- 线程操作,参考代码
- IOS Swift学习之函数
- 第二章
- ThinkPHP3.2创建控制文件及调用控制器中的方法
- VKTM导致ASMB终止导致ORALCE实例宕
- Android Multi-User
- cocos2dx 大地图分块加载的研究(初)
- RPC框架几行代码就够了
- Missing artifact javax.jms:jms:jar: Missing artifact com.sun.jdmk Missing artifact com.sun.jmx:jmxri
- 二叉树遍历的非递归算法
- u-boot 2、配置
- Diesel engine Designer watches sale made on-line for the favorite versions immediately
- 在线接收短信和电话验证平台 收集
- 文档根元素 "beans" 必须匹配 DOCTYPE 根 "null"
- Bootstrap环境及屏幕适配-(一)