您的位置:首页 > 其它

算法导论-8-3-排序不同长度的数据项

2012-06-23 15:14 267 查看

一、题目

a)给定一个整数数组,其中不同的整数中包含的数字个数可能不同,但是该数组中,所有整数中总的数字数为n。说明如何在O(n)时间内对该数组进行排序
b)给定一个字符串数组,其中不同的串包含的字符个数可能不同,但所有串中总的字符个数为n。说明如何在O(n)时间内对该数组进行排序
(注意此处的顺序是指标准的字母顺序,例如,a < ab < b)

二、思路

这两题方法是一样的,仅仅是数据类型和进制的区别。本文就以a)为例。
假设:n:所有整数中总的字数NUMBER_COUNT:数组中整数的个数MAX_DIGIT:数组中具有位数最多的那个数的位数
本章主题是非比较排序,又因为题目中已有暗示,效率与数字的位数有关,因此很容易想到的是基数排序。原始基数排序的时间复杂度:O(NUMBER_COUNT * MAX_DIGIT)
很显然,原始的基数排序不能满足需求,要作一些改进。分析发现,所有的整数都必须要经过MAX_DIGIT次计算,实际上,对于数位不足的MAX_DIGIT的整数,是不需要计算那么多次的。如果先对所有的整数分类,位数少的整数,就计算次数少一点,位数多的整数多计算多一点。
这个预分类,就是桶排序的思想了。先根据整数的位数分装到不同的桶中,然后对每个桶分别做基数排序,这样,有些桶中的元素就不需要计算那么多次了。最极端的方法,就是每个位数一个桶了 。那么就是MAX_DIGIT个桶,每i个桶装的是具有i位数的整数。这个桶中的元素只需要做i次计算。
原始的桶排序是有链表实现的。但是考虑到接下来要对每个桶做基数排序,链表做的桶就不合适了,因为基数排序需要对数据的随机访问。于是我只是借用了桶排序的预分类思想,而在实际代码中是以数组的方式实现了。即,仍是同样的大小的数组,但是按位数从小到大排。相同位数的数不排序。
如果把每个元素的位数看成是这个元素的关键字,然后以关键字从小到大的排序的话,是不是有点像计数排序了?哇!小小一道题,竟然融合了桶排序、计数排序、基数排序这三种最主要的非比较排序,太厉害了!1.借用桶排序的思想,先根据位数对所有元素粗排序,然后对每个桶中的元素,根据元素本身的大小进行精确排序2.粗排序使用计数排序O(NUMBER_COUNT)3.精确排序使用基数排序O(MAX_DIGIT)
也可以用字典树,见算法导论-12-2-基数树

三、代码

产品代码测试代码可以用git下载、更新、提交、评论
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: