您的位置:首页 > 编程语言

编程珠玑(第二版)读书笔记【1、2】

2011-05-10 21:54 239 查看

第一章

问题:
一个文件F,包含最多1000万条无序的、不重复的记录,每条记录都是一个7位的十进制正整数,利用1MB左右的内存空间,按照整数的大小对文件进行升序排序,将结果保存到文件FO中。

分析:
1MB内存,共有1024*1024*8=8388608bit,如果每个正整数采用32位二进制存储,可以存放1024*1024*8/32=262144条记录。一个7位十进制正整数在[1,10000000)之间。

解决方案1:
使用基于临时文件的归并排序,大致的方法如下:
第一次从F中读取前250000条记录,在内存中用快速排序进行排序,输出到一个临时文件TmpF0中,之后以此类推,每次从F中读取250000条记录,排序后存入临时文件TmpFi中。
最后,将临时文件TmpF0-TmpF39,这40个临时文件进行归并,存入FO。

解决方案2:
40趟读取F,方法大致如下:
分40趟,第一趟从F中找出数值在0-249999之间的记录,放入内存,用快速排序进行排序,然后保存到输出文件FO中。这样就省去了临时文件,但需要从头到尾将输入文件F读取40次。

解决方案3:
位图法,方法大致如下:
由于记录的数值不超过1000万,可以用1000万个bit来标记一个整数是否存在,这样需要1.192MB的内存空间就可以标记所有的7位正整数。先将这1000万个bit全部置零,然后对F扫描,如果一个数值存在,则将对应的位置1,最后将对应位为1的数值按照升序写入文件FO。

第二章

第二章中解决了三个小问题;
A、找出顺序文件中缺失的记录。用的是二分查找的方法。
B、在正比于n的时间内将一个n元一维向量循环左移i个位置(i < n)。
此问题解决方法是将向量中0到i-1号元素翻转,再将i到n-1号元素翻转,最后将整个向量翻转,即:
Reverse(0, i-1);
Reverse(I, n-1);
Reverse(0, n-1);
C、找出英语词典中所有变位词的集合。变位词就是例如pots、stop、tops这样的单词。
此问题解决方法是给词典中的每一个单词做标识,比如将每个单词中的字母按字典序排列后作为该单词的标识,然后所有单词按照标识排序,最后去掉重复的标识。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: