Hive中order by、sort by、distribute by、cluster by的区别
2017-12-05 21:44
447 查看
--------Hive的底层是MapReduce--------
order by:对全局数据的一个排序,仅仅只有一个reduce。
sort by :有多个reduce,对每一个reduce内部数据进行排序,全局结果集没有排序 。
设置reduce的个数:set mapreduce.job.reduces=[number]
distribute by :类似于MapReduce中partition的功能,对数据进行分区,结合sort by进行使用。但是必须要在sort by之前,因为要先分区,再排序。
cluster by: sort by 和distribute by的结合,当sort by和distribute by字段相同时使用 cluster by 。
order by:对全局数据的一个排序,仅仅只有一个reduce。
sort by :有多个reduce,对每一个reduce内部数据进行排序,全局结果集没有排序 。
设置reduce的个数:set mapreduce.job.reduces=[number]
distribute by :类似于MapReduce中partition的功能,对数据进行分区,结合sort by进行使用。但是必须要在sort by之前,因为要先分区,再排序。
cluster by: sort by 和distribute by的结合,当sort by和distribute by字段相同时使用 cluster by 。
相关文章推荐
- hive的order by、sort by、cluster by、distribute by的区别与用法
- hive中order by,sort by,distribute by,Cluster By的区别
- Hive中order by,sort by,distribute by,cluster by的区别
- Hive中order by,sort by,distribute by,cluster by的区别
- Hive中order by,sort by,distribute by,cluster by的区别
- hive 中的Sort By、 Order By、Cluster By、Distribute By 区别
- Hive中order by,sort by,distribute by,cluster by的区别
- Hive中order by,sort by,distribute by,cluster by的区别
- Hive中order by,sort by,distribute by,cluster by的区别
- hive 中的Sort By、 Order By、Cluster By、Distribute By 区别<转>
- hive 之 order by,sort by, distribute by, cluster by 区别
- hive排序:distribute by 、sort by 、cluster by 、order by 区别
- hive中order by、distribute by、sort by和cluster by的区别和联系
- HIVE 中 order by, sort by, distribute by, cluster by的用法和区别
- hive中order by,sort by, distribute by, cluster by作用以及用法
- hive中order by,sort by, distribute by, cluster by作用以及用法
- hive中order by,sort by, distribute by, cluster by的用法
- hive中order by,sort by, distribute by, cluster by作用以及用法
- Hive中order by,sort by,distribute by,cluster by
- hive中order by,sort by, distribute by, cluster by作用以及用法