您的位置：首页 > 其它

排序算法之堆排序

2017-06-24 21:32 465 查看

堆排序
前言

堆排序、快速排序、归并排序的平均时间复杂度都为，由于堆排序对原始记录的排序状态并不敏感，因此无论是最好、最坏和平均时间复杂度均为。这在性能上显然要远远好于冒泡排序、简单选择排序、直接插入排序的的时间复杂度了。

空间复杂度上，它只有一个用来交换的暂存单元，也非常不错。不过由于记录的比较与交换是跳跃式进行，因此堆排序是一种不稳定的排序算法

此外，由于初始构建堆所需的比较次数较多，因此，它并不适合待排序序列个数较少的情况。

二叉堆

     二叉堆是具有下列性质的完全二叉树

（1）    二叉堆的父节点的值总是大于或等于（小于或等于）其左右孩子的值；

（2）    每个节点的左右子树都是这样的一棵二叉堆。

每个节点的值都大于或等于其左右孩子节点的值，称为大顶堆；或者每个节点的值都小于或等于其左右孩子节点的值，称为小顶堆。

堆排序算法

       堆排序（Heap Sort）就是利用堆（假设利用大顶堆）进行排序的方法。它的基本思想是：将待排序的序列构造成一个大顶堆。此时，整个序列的最大值就是堆顶的根节点。将它移走（其实就是讲其与堆数组的末尾元素交换，此时末尾元素就是最大值），然后将剩余的n-1个序列重新构造成一个堆，这样就会得到n个元素中的次大值。如此反复执行，便能得到一个有序序列了。

       由于输入的是一个无序数列，因此要实现堆排序，需要解决以下两个问题：

（1）    如何将一个无序序列建成一个堆（二叉堆构建）

（2）    在去掉堆顶元素后，如何将剩下的元素调整为一个二叉堆（二叉堆调整）

针对第一个问题，可能很明显会想到利用堆的插入操作，一个一个的插入元素，每次插入后调整元素的位置，使得新的序列依然为二叉堆。这种操作一般是自底向上的调整操作，即先将待插入元素放在二叉堆后面，而后逐渐向上将其与父节点比较，进而调整位置。但根据二叉堆的特点，完全用不着这么做，我们只需先解决第二个问题，自然第一个问题也就迎刃而解了。

二叉堆调整

假设我们排序的目标是从小到大，因此我们使用大顶堆；我们将二叉堆中的元素以程序遍历后的顺序保存在一维数组中，根节点在数组中的位置序号为0。

这样，如果某个节点的位置序号为i，那么它的左右孩子的位置序号分别为2i+1和2i+2。

为了使调整过程更容易理解，我们采用如下的二叉堆来分析：

这里数组A中的元素个数为8，很明显最大值为A0，为了实现排序后的元素按照从小到大的顺序排列，我们可以将二叉堆中的最后一个元素A7与A0交换，这样A7中保存的就是数组中的最大值，而此时二叉堆变成如下情况：

为了将其调整为二叉堆，我们需要寻找4应该插入的位置。为此，我们让4与它的孩子节点中的最大的那个，也就是其左孩子7，进行比较，由于4<7，将4与7交换，这样二叉树变成如下的形式：

接下来，继续让4与其左右孩子节点中的最大者，即6，进行比较，同样由于4<6，交换4与6，这样二叉树变成如下形式：

这样便又构成二叉堆，这时A0为7，是所有元素中的最大值。同样，我们将二叉堆中的最后一个元素A6与A0交换，这样A6中保存的就是数组中第二大元素6，而A0就变成了3，如下图所示：

为了将其调整成为二叉堆，将3与其左右孩子中的最大者即6进行比较，由于3<6，因此将3与6交换，继续比较交换后的二叉树中3和其左右孩子中的最大者4，得到以下二叉堆：

同样将A0与此时堆中的最后一个元素A5交换，同样A5保存的就是数组中第三大元素，再次调整剩余的节点，如此反复，直到堆中仅剩最后一个元素，这时整个数组便已按照从小到大的顺序排列好了。

代码：

/*******************
*    Heap Sort
*
* Date: 2017/0624
*
* ****************/

#include
using namespace std;

/*
*
* arr[start+1...end]满足最大堆定义，
* 将arr[start]加入到最大堆arr[start+1...end]中，
* 调整arr[start]的位置，使arr[start...end]也成为最大堆。
* 注：由于数组从0开始计算序号，也就是二叉堆的根节点序号为0，
* 因此序号为i的节点的左右孩子节点序号分别为2i+1, 2i+2
*
*/

void HeapAdjustDown(int* arr, int start, int end){
int temp = arr[start];
int i = 2*start + 1;
while(i <= end){
//找出左右孩子节点中最大的那个
if(i + 1 <= end && arr[i] < arr[i+1])
i++;
//符合堆的定义，则不用调整
if(arr[i] < temp)
break;
arr[start] = arr[i];
start = i;
i = 2*start + 1;
}
arr[start] = temp;
}

//堆排序后的顺序为从小到大，因此建立大顶堆

void HeapSort(int* arr, int len){
int i;
//把数组建成大顶堆
//第一个非叶子结点的位置序号为len/2-1
for(i=len/2-1; i>=0; i--)
HeapAdjustDown(arr, i, len-1);

//进行堆排序
for(i=len-
4000
1; i>0; i--){
//堆顶元素和最后一个元素交换
//这样最后一个元素保存的是最大数
//每次循环依次将次大的数放在其前面的位置
//这样得到的顺序就是从小到大

int temp = arr[i];
arr[i] = arr[0];
arr[0] = temp;

//将arr[0...i-1]重新调整为大顶堆
HeapAdjustDown(arr, 0, i-1);
}
}

int main(){

int a[] = {1, 7, 8, 9, 3, 4, 2, 6, 5, 0};
cout << "Original array: ";
for(int i=0; i<10; i++)
cout << a[i] << " ";
cout << endl;

HeapSort(a, 10);
cout << "HeapSorted array: ";
for(int i=0; i<10; i++)
cout << a[i] << " ";
cout << endl;

return 0;
}

运行结果：

总结

复杂度：我们在重新调整堆时，都要将父节点与孩子节点进行比较，这样，每次重新调整堆的时间复杂度变为，而堆排序有n-1次重新调整堆的操作，建堆时有（（len-1）/2+1）次重新调整堆的操作，因此堆排序的平均时间复杂度为。由于我们这里没有借助辅助存储空间，因此空间复杂度为。

堆排序在排序元素较少时有点大材小用，待排序元素较多时，堆排序还是很有效的。另外，堆排序在最坏情况下，时间复杂度也为。相对于快速排序（平均复杂度），最坏情况下，这是堆排序最大的优点。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 堆排序 Heap Sort 大顶堆二叉堆

相关文章推荐

新的分享

章节导航