您的位置：首页 > 编程语言 > Java开发

经典（java版）排序算法的分析及实现之二希尔排序

2014-10-21 22:51 288 查看

插入排序―希尔排序
希尔排序是1959 年由D.L.Shell 提出来的，相对直接插入排序有较大的改进。希尔排序的实质就是分组插入排序，该方法又称缩小增量排序。
基本算法：

先将整个待排元素序列分割成若干个子序列（由相隔某个“增量”的元素组成的）分别进行直接插入排序，然后依次缩减增量再进行排序，待整个序列中的元素基本有序（增量足够小）时，再对全体元素进行一次直接插入排序。因为直接插入排序在元素基本有序的情况下（接近最好情况），效率是很高的，因此希尔排序在时间效率上比前两种方法有较大提高。步长的选择是希尔排序的重要部分。只要最终步长为1任何步长序列都可以工作。
算法最开始以一定的步长进行排序,然后会继续以一定步长进行排序，最终算法以步长为1进行排序。当步长为1时，算法变为插入排序，这就保证了数据一定会被排序。Donald Shell 最初建议步长选择为\frac{n}{2}并且对步长取半直到步长达到 1。虽然这样取可以比\mathcal{O}(n^2)类的算法（插入排序）更好，但这样仍然有减少平均时间和最差时间的余地。
希尔排序示例:n=10的一个数组 58 27 32 93 65 87 58 46 9 65，步长为n/2。

第一次排序步长为 10/2 = 5

58 27 32 93 65 87 58 46 9 65
1A 1B
2A 2B
3A 3B
4A 4B
5A 5B
首先将待排序元素序列分组，以5为步长，(1A,1B),(2A,2B),(3A,3B)等为分组标记，大写字母表示是该组的第几个元素,数字相同的表示在同一组，这样就分成5组，即(58,87),(27,58),(32,46),(93,9),(65,65)，然后分别对各分组进行直接插入排序，排序后5组为(58,87),(27,58),(32,46),(9,93),(65,65)，分组排序只是变得各个分组内的下表，下同。
第二次排序步长为 5/2 = 2
58 27 32 9 65 87 58 46 93 65
1A 1B 1C 1D 1E
2A 2B 2C 2D 2E
第三次排序步长为 2/2 = 1
32 9 58 27 58 46 65 65 93 87
1A 1B 1C 1D 1E 1F 1G 1H 1I 1J
第四次排序步长为 1/2 = 0 得到有序元素序列
9 27 32 46 58 58 65 65 87 93
按照希尔排序算法定义

/**
* 按照希尔排序定义实现
*
* @param sortList
*/
static void shellSort1(Integer[] sortList) {
int i, j, step;
int len = sortList.length;
// 步长除以2
for (step = len / 2; step > 0; step /= 2)
/**
*  分别对每个分组进行直接插入排序
*/
for (i = 0; i < step; i++)
{
for (j = i + step; j < len; j += step)
if (sortList[j] < sortList[j - step]) {
int temp = sortList[j];
int k = j - step;
while (k >= 0 && sortList[k] > temp) {
sortList[k + step] = sortList[k];
k -= step;
}
sortList[k + step] = temp;
}
}
}

对上面的代码进行优化，按照从从第一个步长数据开始，依次对每个元素与自己组内的数据进行直接插入排序

/**
* 从第一个步长数据开始，依次对每个元素与自己组内的数据进行直接插入排序
* @param sortList
*/
static void shellSort2(Integer[] sortList) {
int j, step;
int len = sortList.length;
for (step = len / 2; step > 0; step /= 2)
for (j = step; j < len; j++)
/**
* 从数组第step个元素开始，然后将每个元素与自己组内的数据进行直接插入排序
*/
if (sortList[j] < sortList[j - step]) {
int temp = sortList[j];
int k = j - step;
while (k >= 0 && sortList[k] > temp) {
sortList[k + step] = sortList[k];
k -= step;
}
sortList[k + step] = temp;
}
}

算法复杂度
1、时间复杂度
希尔排序耗时的操作有：比较 + 后移赋值。时间复杂度如下：
1) 最好情况：序列是升序排列，在这种情况下，需要进行的比较操作需（n-1）次。后移赋值操作为0次。即O(n)
2) 最坏情况：O(nlog2n)。
3) 渐进时间复杂度（平均时间复杂度）：O(nlog2n)
平均时间复杂度：O(nlog2n)，希尔排序在最坏的情况下和平均情况下执行效率相差不是很多，与此同时快速排序（O(log2n)）在最坏的情况下执行的效率会非常差。专家们提倡，几乎任何排序工作在开始时都可以用希尔排序，若在实际使用中证明它不够快，再改成快速排序这样更高级的排序算法。
增量序列的选择
Shell排序的执行时间依赖于增量序列。
1) 最后一个增量必须为1；
2) 应该尽量避免序列中的值(尤其是相邻的值)互为倍数的情况。
Shell排序的时间性能优于直接插入排序
1）当文件初态基本有序时直接插入排序所需的比较和移动次数均较少。
2）当n值较小时，n和

的差别也较小，即直接插入排序的最好时间复杂度O(n)和最坏时间复杂度0(

)差别不大。
3）在希尔排序开始时增量较大，分组较多，每组的记录数目少，故各组内直接插入较快，后来增量di逐渐缩小，分组数逐渐减少，而各组的记录数目逐渐增多，但由于已经按di-1作为距离排过序，使文件较接近于有序状态，所以新的一趟排序过程也较快。
2、空间复杂度：O(1)
希尔排序是在原输入数组上进行后移赋值操作的（称“就地排序”），所需开辟的辅助空间跟输入数组规模无关，所以空间复杂度为：O(1)
稳定性
由于多次插入排序，我们知道一次插入排序是稳定的，不会改变相同元素的相对顺序，但在不同的插入排序过程中，相同的元素可能在各自的插入排序中移动，最后其稳定性就会被打乱，所以shell排序是不稳定的。

本文出自 “滴水穿石” 博客，请务必保留此出处http://honeybee.blog.51cto.com/9309920/1566485

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航