排序算法之堆排序
2017-06-24 21:32
465 查看
堆排序
前言
堆排序、快速排序、归并排序的平均时间复杂度都为,由于堆排序对原始记录的排序状态并不敏感,因此无论是最好、最坏和平均时间复杂度均为。这在性能上显然要远远好于冒泡排序、简单选择排序、直接插入排序的的时间复杂度了。
空间复杂度上,它只有一个用来交换的暂存单元,也非常不错。不过由于记录的比较与交换是跳跃式进行,因此堆排序是一种不稳定的排序算法
此外,由于初始构建堆所需的比较次数较多,因此,它并不适合待排序序列个数较少的情况。
二叉堆
二叉堆是具有下列性质的完全二叉树
(1) 二叉堆的父节点的值总是大于或等于(小于或等于)其左右孩子的值;
(2) 每个节点的左右子树都是这样的一棵二叉堆。
每个节点的值都大于或等于其左右孩子节点的值,称为大顶堆;或者每个节点的值都小于或等于其左右孩子节点的值,称为小顶堆。
堆排序算法
堆排序(Heap Sort)就是利用堆(假设利用大顶堆)进行排序的方法。它的基本思想是:将待排序的序列构造成一个大顶堆。此时,整个序列的最大值就是堆顶的根节点。将它移走(其实就是讲其与堆数组的末尾元素交换,此时末尾元素就是最大值),然后将剩余的n-1个序列重新构造成一个堆,这样就会得到n个元素中的次大值。如此反复执行,便能得到一个有序序列了。
由于输入的是一个无序数列,因此要实现堆排序,需要解决以下两个问题:
(1) 如何将一个无序序列建成一个堆(二叉堆构建)
(2) 在去掉堆顶元素后,如何将剩下的元素调整为一个二叉堆(二叉堆调整)
针对第一个问题,可能很明显会想到利用堆的插入操作,一个一个的插入元素,每次插入后调整元素的位置,使得新的序列依然为二叉堆。这种操作一般是自底向上的调整操作,即先将待插入元素放在二叉堆后面,而后逐渐向上将其与父节点比较,进而调整位置。但根据二叉堆的特点,完全用不着这么做,我们只需先解决第二个问题,自然第一个问题也就迎刃而解了。
二叉堆调整
假设我们排序的目标是从小到大,因此我们使用大顶堆;我们将二叉堆中的元素以程序遍历后的顺序保存在一维数组中,根节点在数组中的位置序号为0。
这样,如果某个节点的位置序号为i,那么它的左右孩子的位置序号分别为2i+1和2i+2。
为了使调整过程更容易理解,我们采用如下的二叉堆来分析:
这里数组A中的元素个数为8,很明显最大值为A0,为了实现排序后的元素按照从小到大的顺序排列,我们可以将二叉堆中的最后一个元素A7与A0交换,这样A7中保存的就是数组中的最大值,而此时二叉堆变成如下情况:
为了将其调整为二叉堆,我们需要寻找4应该插入的位置。为此,我们让4与它的孩子节点中的最大的那个,也就是其左孩子7,进行比较,由于4<7,将4与7交换,这样二叉树变成如下的形式:
接下来,继续让4与其左右孩子节点中的最大者,即6,进行比较,同样由于4<6,交换4与6,这样二叉树变成如下形式:
这样便又构成二叉堆,这时A0为7,是所有元素中的最大值。同样,我们将二叉堆中的最后一个元素A6与A0交换,这样A6中保存的就是数组中第二大元素6,而A0就变成了3,如下图所示:
为了将其调整成为二叉堆,将3与其左右孩子中的最大者即6进行比较,由于3<6,因此将3与6交换,继续比较交换后的二叉树中3和其左右孩子中的最大者4,得到以下二叉堆:
同样将A0与此时堆中的最后一个元素A5交换,同样A5保存的就是数组中第三大元素,再次调整剩余的节点,如此反复,直到堆中仅剩最后一个元素,这时整个数组便已按照从小到大的顺序排列好了。
代码:
运行结果:
总结
复杂度:我们在重新调整堆时,都要将父节点与孩子节点进行比较,这样,每次重新调整堆的时间复杂度变为,而堆排序有n-1次重新调整堆的操作,建堆时有((len-1)/2+1)次重新调整堆的操作,因此堆排序的平均时间复杂度为。由于我们这里没有借助辅助存储空间,因此空间复杂度为。
堆排序在排序元素较少时有点大材小用,待排序元素较多时,堆排序还是很有效的。另外,堆排序在最坏情况下,时间复杂度也为。相对于快速排序(平均复杂度),最坏情况下,这是堆排序最大的优点。
前言
堆排序、快速排序、归并排序的平均时间复杂度都为,由于堆排序对原始记录的排序状态并不敏感,因此无论是最好、最坏和平均时间复杂度均为。这在性能上显然要远远好于冒泡排序、简单选择排序、直接插入排序的的时间复杂度了。
空间复杂度上,它只有一个用来交换的暂存单元,也非常不错。不过由于记录的比较与交换是跳跃式进行,因此堆排序是一种不稳定的排序算法
此外,由于初始构建堆所需的比较次数较多,因此,它并不适合待排序序列个数较少的情况。
二叉堆
二叉堆是具有下列性质的完全二叉树
(1) 二叉堆的父节点的值总是大于或等于(小于或等于)其左右孩子的值;
(2) 每个节点的左右子树都是这样的一棵二叉堆。
每个节点的值都大于或等于其左右孩子节点的值,称为大顶堆;或者每个节点的值都小于或等于其左右孩子节点的值,称为小顶堆。
堆排序算法
堆排序(Heap Sort)就是利用堆(假设利用大顶堆)进行排序的方法。它的基本思想是:将待排序的序列构造成一个大顶堆。此时,整个序列的最大值就是堆顶的根节点。将它移走(其实就是讲其与堆数组的末尾元素交换,此时末尾元素就是最大值),然后将剩余的n-1个序列重新构造成一个堆,这样就会得到n个元素中的次大值。如此反复执行,便能得到一个有序序列了。
由于输入的是一个无序数列,因此要实现堆排序,需要解决以下两个问题:
(1) 如何将一个无序序列建成一个堆(二叉堆构建)
(2) 在去掉堆顶元素后,如何将剩下的元素调整为一个二叉堆(二叉堆调整)
针对第一个问题,可能很明显会想到利用堆的插入操作,一个一个的插入元素,每次插入后调整元素的位置,使得新的序列依然为二叉堆。这种操作一般是自底向上的调整操作,即先将待插入元素放在二叉堆后面,而后逐渐向上将其与父节点比较,进而调整位置。但根据二叉堆的特点,完全用不着这么做,我们只需先解决第二个问题,自然第一个问题也就迎刃而解了。
二叉堆调整
假设我们排序的目标是从小到大,因此我们使用大顶堆;我们将二叉堆中的元素以程序遍历后的顺序保存在一维数组中,根节点在数组中的位置序号为0。
这样,如果某个节点的位置序号为i,那么它的左右孩子的位置序号分别为2i+1和2i+2。
为了使调整过程更容易理解,我们采用如下的二叉堆来分析:
这里数组A中的元素个数为8,很明显最大值为A0,为了实现排序后的元素按照从小到大的顺序排列,我们可以将二叉堆中的最后一个元素A7与A0交换,这样A7中保存的就是数组中的最大值,而此时二叉堆变成如下情况:
为了将其调整为二叉堆,我们需要寻找4应该插入的位置。为此,我们让4与它的孩子节点中的最大的那个,也就是其左孩子7,进行比较,由于4<7,将4与7交换,这样二叉树变成如下的形式:
接下来,继续让4与其左右孩子节点中的最大者,即6,进行比较,同样由于4<6,交换4与6,这样二叉树变成如下形式:
这样便又构成二叉堆,这时A0为7,是所有元素中的最大值。同样,我们将二叉堆中的最后一个元素A6与A0交换,这样A6中保存的就是数组中第二大元素6,而A0就变成了3,如下图所示:
为了将其调整成为二叉堆,将3与其左右孩子中的最大者即6进行比较,由于3<6,因此将3与6交换,继续比较交换后的二叉树中3和其左右孩子中的最大者4,得到以下二叉堆:
同样将A0与此时堆中的最后一个元素A5交换,同样A5保存的就是数组中第三大元素,再次调整剩余的节点,如此反复,直到堆中仅剩最后一个元素,这时整个数组便已按照从小到大的顺序排列好了。
代码:
/******************* * Heap Sort * * Date: 2017/0624 * * ****************/ #include using namespace std; /* * * arr[start+1...end]满足最大堆定义, * 将arr[start]加入到最大堆arr[start+1...end]中, * 调整arr[start]的位置,使arr[start...end]也成为最大堆。 * 注:由于数组从0开始计算序号,也就是二叉堆的根节点序号为0, * 因此序号为i的节点的左右孩子节点序号分别为2i+1, 2i+2 * */ void HeapAdjustDown(int* arr, int start, int end){ int temp = arr[start]; int i = 2*start + 1; while(i <= end){ //找出左右孩子节点中最大的那个 if(i + 1 <= end && arr[i] < arr[i+1]) i++; //符合堆的定义,则不用调整 if(arr[i] < temp) break; arr[start] = arr[i]; start = i; i = 2*start + 1; } arr[start] = temp; } //堆排序后的顺序为从小到大,因此建立大顶堆 void HeapSort(int* arr, int len){ int i; //把数组建成大顶堆 //第一个非叶子结点的位置序号为len/2-1 for(i=len/2-1; i>=0; i--) HeapAdjustDown(arr, i, len-1); //进行堆排序 for(i=len- 4000 1; i>0; i--){ //堆顶元素和最后一个元素交换 //这样最后一个元素保存的是最大数 //每次循环依次将次大的数放在其前面的位置 //这样得到的顺序就是从小到大 int temp = arr[i]; arr[i] = arr[0]; arr[0] = temp; //将arr[0...i-1]重新调整为大顶堆 HeapAdjustDown(arr, 0, i-1); } } int main(){ int a[] = {1, 7, 8, 9, 3, 4, 2, 6, 5, 0}; cout << "Original array: "; for(int i=0; i<10; i++) cout << a[i] << " "; cout << endl; HeapSort(a, 10); cout << "HeapSorted array: "; for(int i=0; i<10; i++) cout << a[i] << " "; cout << endl; return 0; }
运行结果:
总结
复杂度:我们在重新调整堆时,都要将父节点与孩子节点进行比较,这样,每次重新调整堆的时间复杂度变为,而堆排序有n-1次重新调整堆的操作,建堆时有((len-1)/2+1)次重新调整堆的操作,因此堆排序的平均时间复杂度为。由于我们这里没有借助辅助存储空间,因此空间复杂度为。
堆排序在排序元素较少时有点大材小用,待排序元素较多时,堆排序还是很有效的。另外,堆排序在最坏情况下,时间复杂度也为。相对于快速排序(平均复杂度),最坏情况下,这是堆排序最大的优点。
相关文章推荐
- 【排序算法】——堆排序
- 排序算法之堆排序
- 排序算法(四)、选择排序 —— 简单选择排序 和 堆排序
- java排序算法之堆排序
- 排序算法:堆排序
- 常用排序算法C++实现(堆排序,快速排序,归并排序,基数排序)
- 【排序算法】之堆排序的实现
- 排序算法汇总(选择排序 ,直接插入排序,冒泡排序,希尔排序,快速排序,堆排序)
- 【排序算法】堆排序原理及Java实现
- 排序算法之直接插入、希尔排序、堆排序三者比较
- 排序算法-选择排序之堆排序
- 排序算法---堆排序
- 排序算法(归并排序, 快速排序, 堆排序)
- 元素排序几种常用的排序算法的分析及java实现(希尔排序,堆排序,归并排序,快速排序,选择排序,插入排序,冒泡排序)
- 排序算法之堆排序
- 排序算法:堆排序
- 浅析各类排序算法(七) 选择类排序之堆排序
- 排序算法_堆排序(最大堆、最小堆)
- 排序算法4-堆排序
- 漫谈经典排序算法:一、从简单选择排序到堆排序的深度解析