您的位置：首页 > 编程语言

编程珠玑（第二版）读书笔记【1、2】

2011-05-10 21:54 239 查看

第一章

问题：
一个文件F，包含最多1000万条无序的、不重复的记录，每条记录都是一个7位的十进制正整数，利用1MB左右的内存空间，按照整数的大小对文件进行升序排序，将结果保存到文件FO中。

分析：
1MB内存，共有1024*1024*8=8388608bit，如果每个正整数采用32位二进制存储，可以存放1024*1024*8/32=262144条记录。一个7位十进制正整数在[1,10000000)之间。

解决方案1：
使用基于临时文件的归并排序，大致的方法如下：
第一次从F中读取前250000条记录，在内存中用快速排序进行排序，输出到一个临时文件TmpF0中，之后以此类推，每次从F中读取250000条记录，排序后存入临时文件TmpFi中。
最后，将临时文件TmpF0-TmpF39，这40个临时文件进行归并，存入FO。

解决方案2：
40趟读取F，方法大致如下：
分40趟，第一趟从F中找出数值在0-249999之间的记录，放入内存，用快速排序进行排序，然后保存到输出文件FO中。这样就省去了临时文件，但需要从头到尾将输入文件F读取40次。

解决方案3：
位图法，方法大致如下：
由于记录的数值不超过1000万，可以用1000万个bit来标记一个整数是否存在，这样需要1.192MB的内存空间就可以标记所有的7位正整数。先将这1000万个bit全部置零，然后对F扫描，如果一个数值存在，则将对应的位置1，最后将对应位为1的数值按照升序写入文件FO。

第二章

第二章中解决了三个小问题;
A、找出顺序文件中缺失的记录。用的是二分查找的方法。
B、在正比于n的时间内将一个n元一维向量循环左移i个位置(i < n)。
此问题解决方法是将向量中0到i-1号元素翻转，再将i到n-1号元素翻转，最后将整个向量翻转，即：
Reverse(0, i-1);
Reverse(I, n-1);
Reverse(0, n-1);
C、找出英语词典中所有变位词的集合。变位词就是例如pots、stop、tops这样的单词。
此问题解决方法是给词典中的每一个单词做标识，比如将每个单词中的字母按字典序排列后作为该单词的标识，然后所有单词按照标识排序，最后去掉重复的标识。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航