您的位置:首页 > 其它

hive 中order by 与 sort by 的区别

2015-07-03 16:20 302 查看
相信大家在执行Hive语句时要进行排序时总会第一想到order by,我也是!

但每次只要是涉及到order by 都发现MapReduce了好久

今天我尝试了用sort by 代替了order by惊讶地发现MapReduce时间远远比使用order by的时间更短!

以下是具体的

执行了select ip,count(ip) from ip_to_country group by ip order by ip;

发现MapReduce过程如下第一张图



执行了select ip,count(ip) from ip_to_country group by ip sort by ip;

发现MapReduce过程如下第二张图



可以通过观察所花时间看出来!

还有因为在这个过程中每个执行语句都涉及到两个MapReduce任务,所以每张图才会有两个mapreduce过程!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: