您的位置:首页 > 其它

浅析常用的排序算法

2015-08-21 17:34 489 查看
排序分内排序和外排序。

内排序:指在排序期间数据对象全部存放在内存的排序。

外排序:指在排序期间全部对象个数太多,不能同时存放在内存,必须根据排序过程的要求,不断在内、外存之间移动的排序。

内排序的方法有许多种,按所用策略不同,可归纳为五类:插入排序、选择排序、交换排序、归并排序、分配排序和计数排序。

插入排序主要包括直接插入排序,折半插入排序和希尔排序两种;

选择排序主要包括直接选择排序和堆排序;

交换排序主要包括冒泡排序和快速排序;

归并排序主要包括二路归并(常用的归并排序)和自然归并。

分配排序主要包括箱排序和基数排序。

计数排序就一种。

稳定排序:假设在待排序的文件中,存在两个或两个以上的记录具有相同的关键字,在用某种排序法排序后,若这些相同关键字的元素的相对次序仍然不变,则这种排序方法是稳定的。

其中冒泡,插入,基数,归并属于稳定排序;选择,快速,希尔,堆属于不稳定排序。

选择排序、插入排序、归并排序、希尔排序、快速排序等。

排序算法经过了很长时间的演变,产生了很多种不同的方法。对于初学者来说,对它们进行整理便于理解记忆显得很重要。每种算法都有它特定的使用场合,很难通用。因此,我们很有必要对所有常见的排序算法进行归纳。

我不喜欢死记硬背,我更偏向于弄清来龙去脉,理解性地记忆。

比如下面这张图,我们将围绕这张图来思考几个问题。





上面的这张图来自一个PPT。它概括了数据结构中的所有常见的排序算法。现在有以下几个问题:

1、每个算法的思想是什么?

2、每个算法的稳定性怎样?时间复杂度是多少?
3、在什么情况下,算法出现最好情况 or 最坏情况?

4、每种算法的具体实现又是怎样的?
注:一般情况下,最大复杂度和平均复杂度相等,除去款速排序。
堆和归并排序的复杂度相同,且最大,平均,最小也相同。
一般二分都复杂度都和logN相关

上面的冒泡排序是改进后的,即增加了交换标志

希尔排序的复杂度比较难分析

貌似直接选择排序的性能最差而且不稳定

这个是排序算法里面最基本,也是最常考的问题。下面是我的小结。

一、直接插入排序(插入排序)。

1、算法的伪代码(这样便于理解):

INSERTION-SORT (A, n) A[1 . . n]

for j ←2 to n

do key ← A[ j]

i ← j – 1

while i > 0 and A[i] > key

do A[i+1] ← A[i]

i ← i – 1

A[i+1] = key

2、思想:如下图所示,每次选择一个元素K插入到之前已排好序的部分A[1…i]中,插入过程中K依次由后向前与A[1…i]中的元素进行比较。若发现发现A[x]>=K,则将K插入到A[x]的后面,插入前需要移动元素。





3、算法时间复杂度。

最好的情况下:正序有序(从小到大),这样只需要比较n次,不需要移动。因此时间复杂度为O(n)

最坏的情况下:逆序有序,这样每一个元素就需要比较n次,共有n个元素,因此实际复杂度为O(n­2)

平均情况下:O(n­2)

4、稳定性。

理解性记忆比死记硬背要好。因此,我们来分析下。稳定性,就是有两个相同的元素,排序先后的相对位置是否变化,主要用在排序时有多个排序规则的情况下。在插入排序中,K1是已排序部分中的元素,当K2和K1比较时,直接插到K1的后面(没有必要插到K1的前面,这样做还需要移动!!),因此,插入排序是稳定的。

5、代码(c版) blog.csdn.com/whuslei





二、希尔排序(插入排序)

1、思想:希尔排序也是一种插入排序方法,实际上是一种分组插入方法。先取定一个小于n的整数d1作为第一个增量,把表的全部记录分成d1个组,所有距离为d1的倍数的记录放在同一个组中,在各组内进行直接插入排序;然后,取第二个增量d2(<d1),重复上述的分组和排序,直至所取的增量dt=1(dt<dt-1<…<d2<d1),即所有记录放在同一组中进行直接插入排序为止。

例如:将 n 个记录分成 d 个子序列:

{ R[0], R[d], R[2d],…, R[kd] }

{ R[1], R[1+d], R[1+2d],…,R[1+kd] }



{ R[d-1],R[2d-1],R[3d-1],…,R[(k+1)d-1] }





说明:d=5 时,先从A[d]开始向前插入,判断A[d-d],然后A[d+1]与A[(d+1)-d]比较,如此类推,这一回合后将原序列分为d个组。<由后向前>

2、时间复杂度。

最好情况
:由于希尔排序的好坏和步长d的选择有很多关系,因此,目前还没有得出最好的步长如何选择(现在有些比较好的选择了,但不确定是否是最好的)。所以,不知道最好的情况下的算法时间复杂度。

最坏情况下:O(N*logN),最坏的情况下和平均情况下差不多。

平均情况下:O(N*logN)

3、稳定性

由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。(有个猜测,方便记忆:一般来说,若存在不相邻元素间交换,则很可能是不稳定的排序。)

4、代码(c版) blog.csdn.com/whuslei





三、冒泡排序(交换排序)

1、基本思想:通过无序区中相邻记录关键字间的比较和位置的交换,使关键字最小的记录如气泡一般逐渐往上“漂浮”直至“水面”。




2、时间复杂度

最好情况下:
正序有序,则只需要比较n次。故,为O(n)

最坏情况下: 逆序有序,则需要比较(n-1)+(n-2)+……+1,故,为O(N*N)

3、稳定性

排序过程中只交换相邻两个元素的位置。因此,当两个数相等时,是没必要交换两个数的位置的。所以,它们的相对位置并没有改变,冒泡排序算法是稳定的

4、代码(c版) blog.csdn.com/whuslei





四、快速排序(交换排序)

1、思想:它是由冒泡排序改进而来的。在待排序的n个记录中任取一个记录(通常取第一个记录),把该记录放入适当位置后,数据序列被此记录划分成两部分。所有关键字比该记录关键字小的记录放置在前一部分,所有比它大的记录放置在后一部分,并把该记录排在这两部分的中间(称为该记录归位),这个过程称作一趟快速排序。




说明:最核心的思想是将小的部分放在左边,大的部分放到右边,实现分割。

2、算法复杂度

最好的情况下
:因为每次都将序列分为两个部分(一般二分都复杂度都和logN相关),故为 O(N*logN)

最坏的情况下:基本有序时,退化为冒泡排序,几乎要比较N*N次,故为O(N*N)

3、稳定性

由于每次都需要和中轴元素交换,因此原来的顺序就可能被打乱。如序列为 5 3 3 4 3 8 9 10 11会将3的顺序打乱。所以说,快速排序是不稳定的!

4、代码(c版)





五、直接选择排序(选择排序)

1、思想:首先在未排序序列中找到最小元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小元素,然后放到排序序列末尾。以此类推,直到所有元素均排序完毕。具体做法是:选择最小的元素与未排序部分的首部交换,使得序列的前面为有序。




2、时间复杂度。

最好情况下:
交换0次,但是每次都要找到最小的元素,因此大约必须遍历N*N次,因此为O(N*N)。减少了交换次数!

最坏情况下,平均情况下:O(N*N)

3、稳定性

由于每次都是选取未排序序列A中的最小元素x与A中的第一个元素交换,因此跨距离了,很可能破坏了元素间的相对位置,因此选择排序是不稳定的!

4、代码(c版)blog.csdn.com/whuslei





六、堆排序

1、思想:利用完全二叉树中双亲节点和孩子节点之间的内在关系,在当前无序区中选择关键字最大(或者最小)的记录。也就是说,以最小堆为例,根节点为最小元素,较大的节点偏向于分布在堆底附近。




2、算法复杂度

最坏情况下,接近于最差情况下:O(N*logN),因此它是一种效果不错的排序算法。

3、稳定性

堆排序需要不断地调整堆,因此它是一种不稳定的排序

4、代码(c版,看代码后更容易理解!)





七、归并排序

1、思想:多次将两个或两个以上的有序表合并成一个新的有序表。




2、算法时间复杂度

最好的情况下
:一趟归并需要n次,总共需要logN次,因此为O(N*logN)

最坏的情况下,接近于平均情况下,为O(N*logN)

说明:对长度为n的文件,需进行logN 趟二路归并,每趟归并的时间为O(n),故其时间复杂度无论是在最好情况下还是在最坏情况下均是O(nlgn)。

3、稳定性

归并排序最大的特色就是它是一种稳定的排序算法。归并过程中是不会改变元素的相对位置的。

4、缺点是,它需要O(n)的额外空间。但是很适合于多链表排序。

5、代码(略)blog.csdn.com/whuslei

八、基数排序

1、思想:它是一种非比较排序。它是根据位的高低进行排序的,也就是先按个位排序,然后依据十位排序……以此类推。示例如下:








2、算法的时间复杂度

分配需要O(n),收集为O(r),其中r为分配后链表的个数,以r=10为例,则有0~9这样10个链表来将原来的序列分类。而d,也就是位数(如最大的数是1234,位数是4,则d=4),即"分配-收集"的趟数。因此时间复杂度为O(d*(n+r))。

3、稳定性

基数排序过程中不改变元素的相对位置,因此是稳定的!

4、适用情况:如果有一个序列,知道数的范围(比如1~1000),用快速排序或者堆排序,需要O(N*logN),但是如果采用基数排序,则可以达到O(4*(n+10))=O(n)的时间复杂度。算是这种情况下排序最快的!!

5、代码(略)

总结: 每种算法都要它适用的条件,本文也仅仅是回顾了下基础。如有不懂的地方请参考课本。

参考文献:

1. http://www.cnblogs.com/xkfz007/archive/2012/07/01/2572017.html#top
2. http://my.oschina.net/mkh/blog/341172
3. http://blog.csdn.net/whuslei/article/details/6442755
以下为实现代码:

以下列出java中常用的几种排序算法,只是简单实现了排序的功能,还有待改进,望指教(以下均假设数组的长度为n):

1)冒泡排序:

依次比较相邻的两个元素,通过一次比较把未排序序列中最大(或最小)的元素放置在未排序序列的末尾。

[java] view
plaincopyprint?

public class BubbleSort {

public static void sort(int data[]) {

for (int i = 0; i < data.length -1; i++) {

for (int j = 0; j < data.length - i - 1; j++) {

if (data[j] > data[j + 1]) {

int temp = data[j];

data[j] = data[j + 1];

data[j + 1] = temp;

}

}

}

}

}

2)选择排序:

每一次从待排序的数据元素中选出最小(或最大)的一个元素,顺序放在已排好序的数列的最后,直到全部待排序的数据元素排完。

[java] view
plaincopyprint?

public class SelectionSort {

public static void sort(int data[]) {

int minVal;

int minIndex;

for (int i = 0; i < data.length - 1; i++) {

minVal = data[i];

minIndex = i;

for (int j = i + 1; j < data.length; j++) {

if (data[j] < minVal) {

minVal = data[j];

minIndex = j;

}

}

if (minVal != data[i] && minIndex != i) {

data[minIndex] = data[i];

data[i] = minVal;

}

}

}

}

3)插入排序:

将数列分为有序和无序两个部分,每次处理就是将无序数列的第一个元素与有序数列的元素从后往前逐个进行比较,找出插入位置,将该元素插入到有序数列的合适位置中。

[java] view
plaincopyprint?

public class InsertionSort {

public static void sort(int data[]) {

for (int i = 1; i < data.length; i++) {

for (int j = i; j > 0; j--) {

if (data[j] < data[j - 1]) {

int temp = data[j];

data[j] = data[j - 1];

data[j - 1] = temp;

}

}

}

}

}

4)归并排序:

将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列。排序过程如下:

(1)申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列

(2)设定两个指针,最初位置分别为两个已经排序序列的起始位置

(3)比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置

(4)重复步骤3直到某一指针达到序列尾

(5)将另一序列剩下的所有元素直接复制到合并序列尾

[java] view
plaincopyprint?

public class MergeSort {

public static void sort(int data[], int start, int end) {

if (start < end) {

int mid = (start + end) / 2;

sort(data, start, mid);

sort(data, mid + 1, end);

merge(data, start, mid, end);

}

}

public static void merge(int data[], int start, int mid, int end) {

int temp[] = new int[end - start + 1];

int i = start;

int j = mid + 1;

int k = 0;

while (i <= mid && j <= end) {

if (data[i] < data[j]) {

temp[k++] = data[i++];

} else {

temp[k++] = data[j++];

}

}

while (i <= mid) {

temp[k++] = data[i++];

}

while (j <= end) {

temp[k++] = data[j++];

}

for (k = 0, i = start; k < temp.length; k++, i++) {

data[i] = temp[k];

}

}

}

5)快速排序:

通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。

[java] view
plaincopyprint?

public class QuickSort {

public static void sort(int data[], int start, int end) {

if (end - start <= 0) {

return;

}

int last = start;

for (int i = start + 1; i <= end; i++) {

if (data[i] < data[start]) {

int temp = data[++last];

data[last] = data[i];

data[i] = temp;

}

}

int temp = data[last];

data[last] = data[start];

data[start] = temp;

sort(data, start, last - 1);

sort(data, last + 1, end);

}

}

带注释的实现代码:

1 概述
本文对比较常用且比较高效的排序算法进行了总结和解析,并贴出了比较精简的实现代码,包括选择排序、插入排序、归并排序、希尔排序、快速排序等。算法性能比较如下图所示:

2 选择排序
选择排序的第一趟处理是从数据序列所有n个数据中选择一个最小的数据作为有序序列中的第1个元素并将它定位在第一号存储位置,第二趟处理从数据序列的n-1个数据中选择一个第二小的元素作为有序序列中的第2个元素并将它定位在第二号存储位置,依此类推,当第n-1趟处理从数据序列的剩下的2个元素中选择一个较小的元素作为有序序列中的最后第2个元素并将它定位在倒数第二号存储位置,至此,整个的排序处理过程就已完成。
代码如下:
public class SelectionSort {
public void selectionSort(int[] array) {
int temp;
for (int i = 0; i < array.length - 1; i++) {
for (int j = i + 1; j <= array.length - 1; j++) {// 第i个和第j个比较j可以取到最后一位,所以要用j<=array.length-1
if (array[i] > array[j]) {// 注意和冒泡排序的区别,这里是i和j比较。
temp = array[i];
array[i] = array[j];
array[j] = temp;
}
}
// 打印每趟排序结果
for (int m = 0; m <= array.length - 1; m++) {
System.out.print(array[m] + "\t");
}
System.out.println();
}
}

public static void main(String[] args) {
SelectionSort selectionSort = new SelectionSort();
int[] array = { 5, 69, 12, 3, 56, 789, 2, 5648, 23 };
selectionSort.selectionSort(array);
for (int m = 0; m <= array.length - 1; m++) {
System.out.print(array[m] + "\t");
}
}
}


3 插入排序

直接插入排序法的排序原则是:将一组无序的数字排列成一排,左端第一个数字为已经完成排序的数字,其他数字为未排序的数字。然后从左到右依次将未排序的数字插入到已排序的数字中。
代码如下
public class InsertSort {
public void insertSort(int[] array, int first, int last) {
int temp, i, j;
for (i = first + 1; i <= last - 1; i++) {// 默认以第一个数为有序序列,后面的数为要插入的数。
temp = array[i];
j = i - 1;
while (j >= first && array[j] > temp) {// 从后进行搜索如果搜索到的数小于temp则该数后移继续搜索,直到搜索到小于或等于temp的数即可
array[j + 1] = array[j];
j--;
}
array[j + 1] = temp;
// 打印每次排序结果
for (int m = 0; m <= array.length - 1; m++) {
System.out.print(array[m] + "\t");
}
System.out.println();
}
}

public static void main(String[] args) {
InsertSort insertSort = new InsertSort();
int[] array = { 5, 69, 12, 3, 56, 789, 2, 5648, 23 };
insertSort.insertSort(array, 0, array.length);// 注意此处是0-9而不是0-8
for (int i = 0; i <= array.length - 1; i++) {
System.out.print(array[i] + "\t");
}
}
}


4 归并排序
算法描述:
把序列分成元素尽可能相等的两半。
把两半元素分别进行排序。
把两个有序表合并成一个。
代码如下
public class MergeSortTest {
public void sort(int[] array, int left, int right) {
if (left >= right)
return;
// 找出中间索引
int center = (left + right) / 2;
// 对左边数组进行递归
sort(array, left, center);
// 对右边数组进行递归
sort(array, center + 1, right);
// 合并
merge(array, left, center, right);
// 打印每次排序结果
for (int i = 0; i < array.length; i++) {
System.out.print(array[i] + "\t");
}
System.out.println();

}

/**
* 将两个数组进行归并,归并前面2个数组已有序,归并后依然有序
*
* @param array
*            数组对象
* @param left
*            左数组的第一个元素的索引
* @param center
*            左数组的最后一个元素的索引,center+1是右数组第一个元素的索引
* @param right
*            右数组最后一个元素的索引
*/
public void merge(int[] array, int left, int center, int right) {
// 临时数组
int[] tmpArr = new int[array.length];
// 右数组第一个元素索引
int mid = center + 1;
// third 记录临时数组的索引
int third = left;
// 缓存左数组第一个元素的索引
int tmp = left;
while (left <= center && mid <= right) {
// 从两个数组中取出最小的放入临时数组
if (array[left] <= array[mid]) {
tmpArr[third++] = array[left++];
} else {
tmpArr[third++] = array[mid++];
}
}
// 剩余部分依次放入临时数组(实际上两个while只会执行其中一个)
while (mid <= right) {
tmpArr[third++] = array[mid++];
}
while (left <= center) {
tmpArr[third++] = array[left++];
}
// 将临时数组中的内容拷贝回原数组中
// (原left-right范围的内容被复制回原数组)
while (tmp <= right) {
array[tmp] = tmpArr[tmp++];
}
}

public static void main(String[] args) {
int[] array = new int[] { 5, 69, 12, 3, 56, 789, 2, 5648, 23 };
MergeSortTest mergeSortTest = new MergeSortTest();
mergeSortTest.sort(array, 0, array.length - 1);
System.out.println("排序后的数组:");
for (int m = 0; m <= array.length - 1; m++) {
System.out.print(array[m] + "\t");
}
}
}


5 希尔排序

希尔排序(Shell Sort)又称为“缩小增量排序”。是1959年由D.L.Shell提出来的。该方法的基本思想是:先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序。因为直接插入排序在元素基本有序的情况下(接近最好情况),效率是很高的,因此希尔排序在时间效率上比前两种方法有较大提高。
代码如下
public class ShellSort {
public void shellSort(int[] array, int n) {
int i, j, gap;
int temp;
for (gap = n / 2; gap > 0; gap /= 2) {// 计算gap大小
for (i = gap; i < n; i++) {// 将数据进行分组
for (j = i - gap; j >= 0 && array[j] > array[j + gap]; j -= gap) {// 对每组数据进行插入排序
temp = array[j];
array[j] = array[j + gap];
array[j + gap] = temp;
}
// 打印每趟排序结果
for (int m = 0; m <= array.length - 1; m++) {
System.out.print(array[m] + "\t");
}
System.out.println();
}
}
}

public static void main(String[] args) {
ShellSort shellSort = new ShellSort();
int[] array = { 5, 69, 12, 3, 56, 789, 2, 5648, 23 };
shellSort.shellSort(array, array.length);// 注意为数组的个数
for (int m = 0; m <= array.length - 1; m++) {
System.out.print(array[m] + "\t");
}
}
}


6 快速排序
快速排序(Quicksort)是对冒泡排序的一种改进。由C. A. R. Hoare在1962年提出。它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
代码如下
public class QuickSort {
public int partition(int[] sortArray, int low, int height) {
int key = sortArray[low];// 刚开始以第一个数为标志数据
while (low < height) {
while (low < height && sortArray[height] >= key)
height--;// 从后面开始找,找到比key值小的数为止
sortArray[low] = sortArray[height];// 将该数放到key值的左边
while (low < height && sortArray[low] <= key)
low++;// 从前面开始找,找到比key值大的数为止
sortArray[height] = sortArray[low];// 将该数放到key值的右边
}
sortArray[low] = key;// 把key值填充到low位置,下次重新找key值
// 打印每次排序结果
for (int i = 0; i <= sortArray.length - 1; i++) {
System.out.print(sortArray[i] + "\t");
}
System.out.println();
return low;
}

public void sort(int[] sortArray, int low, int height) {
if (low < height) {
int result = partition(sortArray, low, height);
sort(sortArray, low, result - 1);
sort(sortArray, result + 1, height);
}
}

public static void main(String[] args) {
QuickSort quickSort = new QuickSort();
int[] array = { 5, 69, 12, 3, 56, 789, 2, 5648, 23 };
for (int i = 0; i <= array.length - 1; i++) {
System.out.print(array[i] + "\t");
}
System.out.println();
quickSort.sort(array, 0, 8);
for (int i = 0; i <= array.length - 1; i++) {
System.out.print(array[i] + "\t");
}
}
}


总结:

一、稳定性:

  稳定:冒泡排序、插入排序、归并排序和基数排序

  不稳定:选择排序、快速排序、希尔排序、堆排序

二、平均时间复杂度

  O(n^2):直接插入排序,简单选择排序,冒泡排序。

  在数据规模较小时(9W内),直接插入排序,简单选择排序差不多。当数据较大时,冒泡排序算法的时间代价最高。性能为O(n^2)的算法基本上是相邻元素进行比较,基本上都是稳定的。

  O(nlogn):快速排序,归并排序,希尔排序,堆排序。

  其中,快排是最好的, 其次是归并和希尔,堆排序在数据量很大时效果明显。

三、排序算法的选择

  1.数据规模较小

  (1)待排序列基本序的情况下,可以选择直接插入排序

  (2)对稳定性不作要求宜用简单选择排序,对稳定性有要求宜用插入或冒泡

  2.数据规模不是很大

  (1)完全可以用内存空间,序列杂乱无序,对稳定性没有要求,快速排序,此时要付出log(N)的额外空间。

  (2)序列本身可能有序,对稳定性有要求,空间允许下,宜用归并排序

  3.数据规模很大

  (1)对稳定性有求,则可考虑归并排序。

  (2)对稳定性没要求,宜用堆排序

  4.序列初始基本有序(正序),宜用直接插入,冒泡
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: