排序和查找-基数排序 Radix Sorting
2016-05-05 22:16
218 查看
转载自:基数排序(Radix Sorting)
学习笔记
从最低位开始,依次进行排序,从最低位排序一直到最高位排序完成后,数列就变成一个有序序列。
假设有一些二元组(a,b),a为首要关键字,b为次要关键字
(1)先按首要关键字排序,分成首要关键字相同的若干堆
(2)然后按照次要关键字分别对每一堆进行单独排序。
(3)最后将这些堆串联到一起,使首要关键字较小的一堆排在上面。
这种方式的基数排序称为最高有效位排序。
(1)首先按照次要关键字排序
(2)然后对所有的数据按照首要关键字排序
(3) 串联
注意:对关键字排序时,使用的排序算法必须是稳定的,否则会取消前一次排序的结果。由于LSD不需要对每堆单独排序,LSD往往比MSD更简单、开销更小。下面将使用LSD的方式进行基数排序。
算法的稳定性:假定在待排序的序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变(即:原序列ri==rj,而排序后的序列中,ri在rj之前),则称这种排序算法是稳定的,否则是不稳定的。
——引自【DS】排序算法的稳定性
因为这对算法稳定性要求高,所以我们对数位排序使用计数排序(counting sort)。
因为计数排序需要经过d(序列中每条记录的长度)次排序,每次使用计数排序的时间复杂度为O(n),d相当于常量和n无关,所以基数排序的时间复杂度为O(n)。
**注意:
(1)虽然基数排序的时间复杂度为O(n),但每一次迭代代价都很高。
(2)使用计数排序的基数排序不能进行原地排序,需要更多内存,快速排序可能更好地利用硬件缓存,所以相比基数排序,快速排序这些原地排序算法更可取。
(3)对于一个位数有限的十进制数,可把它看成一个多元组,从高位到低位,关键字重要程度依次递减。可以使用基数排序对一些位数有限的十进制数排序。**
示例:
设待排序的序列为7个三位数,将三位数分成:个位、十位、百位。对7个数字依次对其个位、十位、百位进行排序(关键字重要程度倒序),如下图。
显然,每一位的数都在[0,9]区间内,对于每一位的排序可用“计数排序”
学习笔记
1 思路
将所有待比较数值(正整数)统一为同样的位数,位数较短的数前面补零。从最低位开始,依次进行排序,从最低位排序一直到最高位排序完成后,数列就变成一个有序序列。
2 两种方式
基数排序有两种方式:2.1 MSD
第一种,最高有效位(MSD,Most Significant Digit):假设有一些二元组(a,b),a为首要关键字,b为次要关键字
(1)先按首要关键字排序,分成首要关键字相同的若干堆
(2)然后按照次要关键字分别对每一堆进行单独排序。
(3)最后将这些堆串联到一起,使首要关键字较小的一堆排在上面。
这种方式的基数排序称为最高有效位排序。
2.2 LSD
第二种,最低有效位排序(LSD, Least Significant Digit)排序。与第一种相反(1)首先按照次要关键字排序
(2)然后对所有的数据按照首要关键字排序
(3) 串联
注意:对关键字排序时,使用的排序算法必须是稳定的,否则会取消前一次排序的结果。由于LSD不需要对每堆单独排序,LSD往往比MSD更简单、开销更小。下面将使用LSD的方式进行基数排序。
算法的稳定性:假定在待排序的序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变(即:原序列ri==rj,而排序后的序列中,ri在rj之前),则称这种排序算法是稳定的,否则是不稳定的。
——引自【DS】排序算法的稳定性
3 LSD方式的基数排序
3.1 简单描述
将数字拆为个、十、百位,每个位依次排序。因为这对算法稳定性要求高,所以我们对数位排序使用计数排序(counting sort)。
因为计数排序需要经过d(序列中每条记录的长度)次排序,每次使用计数排序的时间复杂度为O(n),d相当于常量和n无关,所以基数排序的时间复杂度为O(n)。
**注意:
(1)虽然基数排序的时间复杂度为O(n),但每一次迭代代价都很高。
(2)使用计数排序的基数排序不能进行原地排序,需要更多内存,快速排序可能更好地利用硬件缓存,所以相比基数排序,快速排序这些原地排序算法更可取。
(3)对于一个位数有限的十进制数,可把它看成一个多元组,从高位到低位,关键字重要程度依次递减。可以使用基数排序对一些位数有限的十进制数排序。**
示例:
设待排序的序列为7个三位数,将三位数分成:个位、十位、百位。对7个数字依次对其个位、十位、百位进行排序(关键字重要程度倒序),如下图。
显然,每一位的数都在[0,9]区间内,对于每一位的排序可用“计数排序”
#include <iostream> using namespace std; // 基数排序:稳定排序 // 打印数组arr按照第k位排序后的结果 // arr[]: 每次待排序的数组 // size:数组大小 // k:要排序的数位 // d: 每个数据的位数 void print(int arr[], int size, int k, int d){ if(k == d) cout << "最终排序结果为:"; else cout << "按第" << k << "位排序后,结果为:"; for(int i = 0; i < size; ++i){ cout << arr[i] <<" "; } cout << endl; } // 获取正整数data的第expIndex位数字(各位为第0位) int getBitData(int data, int expIndex){ while(data > 0 && expIndex > 0){ data /= 10; expIndex--; } return data % 10; } // 利用计数排序对元素的每一位进行排序 int* countingSort(int arr[], const int size, int expIndex){ const int k = 9; // 最大数是9 const int k_p = k + 1; int* b = new int[size]; int* c = new int[k_p]; // 数的每一位最大数为9 // 初始化c数组为0 for(int i = 0; i < k; ++i){ c[i] = 0; } for(int i = 0; i < size; ++i){ // 获取当前位的数字 int d = getBitData(arr[i], expIndex); c[d]++; // 统计当前位数字出现的个数 } for(int i = 1; i <= k; ++i){ c[i] += c[i-1]; // 逐个累加前面的 } for(int i = size - 1; i >= 0; i--){ int d = getBitData(arr[i], expIndex); b[c[d] - 1] = arr[i]; // c[d] - 1就表示小于等于元素d的元素个数,就是d在B的位置 c[d]--; } return b; } // d为序列中每个数据的长度 void radixSorting(int arr[], int size, int d){ // arr = countingSort(arr, 0); for(int i = 0; i < d; ++i){ arr = countingSort(arr, size, i); // 从低位到高位,对数字各位排序 print(arr, size, i+1, d); } } int main(){ int arr[] = { 326, 453, 608, 835, 751, 435, 704, 690, 88, 79, 79 }; // { 333, 956, 175, 345, 212, 542, 99, 87 }; cout << "基数排序前为:"; for(int i = 0; i < 11; ++i){ cout << arr[i] << " "; } cout << endl; radixSorting(arr, 11, 4); }
相关文章推荐
- DatabaseMetaData元数据
- vector和Hashtable
- spring session,集群环境下的session共享解决方案
- 001 java 线程基础
- 数组去重
- ♥ZOJ 3872-Beauty of Array【规律】
- 全局变量$_SERVER
- std::string源码探秘和性能分析
- TFHpple是干什么的?
- 2012 Multi-University #10
- 在Linux下删除 除了某个文件之外的所有文件/目录
- [JavaScript]构造函数中定义prototype的异常现象及研究
- 從Android端鎖定慣用網路類型
- Bootstrap进阶一:Glyphicons 字体图标
- 避坑宝典:如何选择HTML5游戏引擎
- Spring Boot 之 RESRful API 权限控制
- 在线和离线安装Cloudera CDH 5.6.0
- Spring Boot 之 RESRful API 权限控制
- 爆打团队 2016.05.05 站立会议
- form(去掉关闭按钮,禁止调整大小)