您的位置:首页 > 编程语言

《编程珠玑》读书笔记(三)

2012-05-26 17:14 190 查看
《编程珠玑》的第二部分讲的是性能,第三部分讲的是应用,所以我暂时跳过第二部分,直接看应用。

第十一章 排序

排序问题一直是面试的热点!本章首先介绍了插入排序,然后介绍了快速排序,并提出了快速排序的几种改进方法,例如双向划分、随机数划分、以及小范围结合插入排序,三种的性能递增。

排序免不了交换,书中特别指出将swap()函数写入循环中会加速。

插入排序: 稳定,时间复杂度O(n^2),主要代码如下
for ( i = 1 ; i < n ; i ++ )
{
t = x[i];
for( j = i ; j > 0 && x[j-1]>t;j--)
x[j] = x[j-1];
x[j] = t;
}


快速排序: 不稳定;时间复杂度O(nlogn)。

当出现n个相同元素组成的数组时,插入排序性能非常好,总运行时间为O(n),但qsort性能非常糟糕,因此提出改进。

改进二:采用双向划分的方法,代入如下:
void qsort3( l , u )
if l>=u
return
t = x[l];  i = l;  j = u + l;
loop
do  i++  while  i<=u && x[i]<t    //从左往右找到第一个大于等于t的数
do  j--  while  x[j]>t           //从右往左找到第一风格小于等于t的数
if  i > j
break;
swap( i , j )
swap( l , j)
qsort3( l , j-1 )
qsort3( j+1 , u )


改进三:随机元素划分

改进四:快排+插入排序

第十二章 取样问题

本章主要介绍了生成0~n-1区间内m个随机数的三种方法,假设bigrand()函数返回一个随机大整数,例如C库函数rand()返回15位整数。
方法一:bigrand()%remaining<select,时间复杂度O(n)

方法二:C++zhongSTL的set集合,随机生成一个数,插入set中,最后有序输出。用空间换取时间,O(mlogn)

方法三:随机打乱一个数组,输出前m个即可,O(n+mlogn)

第十三章 搜索

本章介绍了5中表示随机整数集合的数据结构:有序数组、有序链表、二叉树、箱、位向量。各自性能如下:

集合表示初始化操作insert操作输出操作总时间空 间
有序数组1mmO(m^2)m
有序链表1mmO(m^2)
2m
二叉树1logmmO(mlogm)
3m
m1mO(m)
3m
位向量n1nO(n)
n/b
有序数组 IntSetArr类 实现于 P129;
有序链表 IntSetList类 实现于 P130;
二叉树 IntSetBST类 实现于 P132;
位向量 IntSetBitVec类 实现于 P134;
箱 IntSetBins类 实现于 P135;
详细代码见《附录E》

本章的边栏介绍了“拼写检查器”的实现。

第十四章 堆

本章首先介绍了堆的性质:一是有序,二是形状,以及用数组来表示堆。

堆的两个关键函数是:siftup()自底向上,siftdown()自顶向下,代码分别实现于P144、P145。

优先级队列(插入和删除操作很频繁)是一种常见的数据结构,主要有三种实现方法:有序序列、无序序列、堆(介于前两者之间的折中方法),三者性能比较如下:

数据结构一次insert时间一次extract时间两种操作各n次时间
有序序列O(n)O(1)O(n^2)
O(logn)O(logn)O(nlogn)
无序序列O(1)O(n)O(n^2)
用堆实现优先级队列的代码在P147,建议动手实践!

最后介绍了堆排序算法,分两步进行:建堆+排序,O(nlogn),习题2,3对堆排序进行了改进,暂未明白。
堆排序代码:
for i = [2 , n)
siftup(i)
for( i = n ; i >= 2 ; i-- )
swap( l , i )
siftdown(i-1);
//x[l]是前i个元素中最大的,将它和x[i]交换使得有序序列多一个元素,因此下移保持堆平衡


第十五章 字符串

本章主要介绍了三种字符串的应用:

1、生成词典,统计单词的个数,分别用C++和C实现。
C++实现使用了STL的set和map,其实本质是平衡搜索树。
C实现使用的是散列表,比C++速度更快。

2、最长重复字串,用后缀数组实现,O(nlogn),需要额外的n个指针空间。

3、生成随机文本,主要了解k阶文本-->k接马尔科夫链。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: