编程珠玑(第二版)读书笔记【1、2】
2011-05-10 21:54
239 查看
第一章
问题:一个文件F,包含最多1000万条无序的、不重复的记录,每条记录都是一个7位的十进制正整数,利用1MB左右的内存空间,按照整数的大小对文件进行升序排序,将结果保存到文件FO中。
分析:
1MB内存,共有1024*1024*8=8388608bit,如果每个正整数采用32位二进制存储,可以存放1024*1024*8/32=262144条记录。一个7位十进制正整数在[1,10000000)之间。
解决方案1:
使用基于临时文件的归并排序,大致的方法如下:
第一次从F中读取前250000条记录,在内存中用快速排序进行排序,输出到一个临时文件TmpF0中,之后以此类推,每次从F中读取250000条记录,排序后存入临时文件TmpFi中。
最后,将临时文件TmpF0-TmpF39,这40个临时文件进行归并,存入FO。
解决方案2:
40趟读取F,方法大致如下:
分40趟,第一趟从F中找出数值在0-249999之间的记录,放入内存,用快速排序进行排序,然后保存到输出文件FO中。这样就省去了临时文件,但需要从头到尾将输入文件F读取40次。
解决方案3:
位图法,方法大致如下:
由于记录的数值不超过1000万,可以用1000万个bit来标记一个整数是否存在,这样需要1.192MB的内存空间就可以标记所有的7位正整数。先将这1000万个bit全部置零,然后对F扫描,如果一个数值存在,则将对应的位置1,最后将对应位为1的数值按照升序写入文件FO。
第二章
第二章中解决了三个小问题;A、找出顺序文件中缺失的记录。用的是二分查找的方法。
B、在正比于n的时间内将一个n元一维向量循环左移i个位置(i < n)。
此问题解决方法是将向量中0到i-1号元素翻转,再将i到n-1号元素翻转,最后将整个向量翻转,即:
Reverse(0, i-1);
Reverse(I, n-1);
Reverse(0, n-1);
C、找出英语词典中所有变位词的集合。变位词就是例如pots、stop、tops这样的单词。
此问题解决方法是给词典中的每一个单词做标识,比如将每个单词中的字母按字典序排列后作为该单词的标识,然后所有单词按照标识排序,最后去掉重复的标识。
相关文章推荐
- 编程珠玑(第二版)读书笔记第一章
- 编程珠玑(第二版)读书笔记【1、2】
- 读书笔记(V) 编程珠玑
- Effective java第二版读书笔记
- Spring In Action(中文第二版)读书笔记(1-1)
- 位图排序及其扩展应用——《编程珠玑》读书笔记
- Effective Java 英文 第二版 读书笔记 Item 13:Minimize the accessibility of classes and members
- Python 基础教程(第二版)读书笔记
- Python核心教程(第二版)读书笔记(一)
- 1.java设计模式(第二版,读书笔记)
- 《鸟哥的Linux私房菜 基础学习篇(第二版)》 读书笔记 第03章 LInux主机的规划
- 字符串反转,神奇的算法-读《编程珠玑(第二版)》 推荐
- UML用户指南第二版-读书笔记-第1章-为什么要建模
- UML用户指南第二版-读书笔记-第2章-UML介绍
- lua程序设计第二版 读书笔记(11-14章)
- lua程序设计第二版 读书笔记(15-17章)
- 《人工智能(智能系统指南,第二版)》读书笔记——9、第八章
- 编程珠玑---读书笔记---堆的实现及堆排序
- 代码大全第二版读书笔记 第二部分-创建高质量的代码 七、高质量的子程序
- 《JavaScript DOM 编程艺术》(第二版)读书笔记(一)