编程珠玑第二章
2013-07-01 21:46
246 查看
A题
给定一个最多包含40亿个随机排列的32位整数的顺序文件,找出一个不在文件中一32位整数。
1、在文件中至少存在这样一个数?
2、如果有足够的内存,如何处理?
3、如果内存不足,仅可以用文件来进行处理,如何处理?
答案:
1、32位整数,包括-2146473648~~2146473647,约42亿个整数,而文件中只有40亿个,必然有整数少了。
2、如果采用位数思想来存放,则32位整数最多需要占用43亿个位。约512MB的内存空间。
3、内存不足,可以采用如下思想:
1、按最高位分为两段,没有出现的那个数,肯定在比较小的段里面。
如果比较少的段最高位为1,那么缺少的那个数的最高位也为1.
如果比较少的段最高位为0,那么少的那个数的最高位也是0.
依次按以上方法去处理每个位。
测每个整数的每个bit是0还是1,读取n=40亿个整数,第1个bit为0或为1的放到不同的文件中(每个至多为n/2亿),少于N/2个数的那组 必定缺少某个数,接着探测第2个bit是0还是1,输入至多n/2亿,输出至多n/4亿,少于N/4个数的那组 必定缺少某个数,以此类推,总的运行时间和n成正比。通过对某组排序扫描可以得到缺失的数,这样运行时间变为o(logn)。
Q2:给定一个包含4300000000个32位整数的顺序文件,请问如何找到一个至少出现两次的整数?
解答:二分查找。由于4.3G>32位的整数空间,肯定会有重复的整数。搜索范围从所有的32位正整数开始(全部当成unsigned
int,简化问题),即[0, 2^32),中间值即为2^31。
然后遍历文件,如果小于2^31的整数个数大于N/2=2^31,则调整搜索范围为[0, 2^31],反之亦然;然后再对整个文件再遍历一遍,直到得到最后的结果。T(n) = T(n/2) + n,总体的复杂度为o(logn)。
例子:数组[4,2,5,1,3,6,3,7,0,7],假定从3位的整数空间内搜索。第一次的范围为[0,8),遍历过后发现[0,4)范围内的整数个数为5,于是调整为搜索[0,4)范围内的整数。第二次发现[2, 4)范围内的证书为3,大于2,于是调整为[2, 4)。再经过第三次的遍历,找出3为重复出现的整数。
B题
字符串循环移位
比如abcdef 左移三位,则变成defabc
基本还是按照书上的算法,
_rev(0, i)
_rev(i, len)
_rev(0, len)
[cpp] view
plaincopy
static void _res(char *a, int n)
{
int i = 0, j = n - 1;
char t;
while (i < j)
{
t = a[i]; a[i] = a[j]; a[j] = t;
++i; --j;
}
}
char *rever(char *a, int n, int len)
{
int i, j;
if (!a || !n) return a;
_res(a, n);
_res(a + n, len - n);
_res(a, len);
return a;
}
C 题
给定一个单词集合,找出可以相互转换的集合。
比如abc bca cba都可以相互转换。
算法如下
把由于每个单词可以进行唯一性标识,把这个单词按照字母进行排序,可以相互转换的单词都有同样的标识。
这里用C++来写了。
[cpp] view
plaincopy
void gen_label(vector<string> &dict, map<string, vector<string> >&rec)
{
for (int i = 0; i < dict.size(); ++i)
{
string line = dict[i];
sort(line.begin(), line.end());
rec[line].push_back(dict[i]);
}
for (map<string, vector<string> >::iterator iter = rec.begin();
iter != rec.end(); ++iter)
{
copy((iter->second).begin(), (iter->second).end(), ostream_iterator<string>(cout , " "));
cout << endl;
}
}
给定一个最多包含40亿个随机排列的32位整数的顺序文件,找出一个不在文件中一32位整数。
1、在文件中至少存在这样一个数?
2、如果有足够的内存,如何处理?
3、如果内存不足,仅可以用文件来进行处理,如何处理?
答案:
1、32位整数,包括-2146473648~~2146473647,约42亿个整数,而文件中只有40亿个,必然有整数少了。
2、如果采用位数思想来存放,则32位整数最多需要占用43亿个位。约512MB的内存空间。
3、内存不足,可以采用如下思想:
1、按最高位分为两段,没有出现的那个数,肯定在比较小的段里面。
如果比较少的段最高位为1,那么缺少的那个数的最高位也为1.
如果比较少的段最高位为0,那么少的那个数的最高位也是0.
依次按以上方法去处理每个位。
测每个整数的每个bit是0还是1,读取n=40亿个整数,第1个bit为0或为1的放到不同的文件中(每个至多为n/2亿),少于N/2个数的那组 必定缺少某个数,接着探测第2个bit是0还是1,输入至多n/2亿,输出至多n/4亿,少于N/4个数的那组 必定缺少某个数,以此类推,总的运行时间和n成正比。通过对某组排序扫描可以得到缺失的数,这样运行时间变为o(logn)。
Q2:给定一个包含4300000000个32位整数的顺序文件,请问如何找到一个至少出现两次的整数?
解答:二分查找。由于4.3G>32位的整数空间,肯定会有重复的整数。搜索范围从所有的32位正整数开始(全部当成unsigned
int,简化问题),即[0, 2^32),中间值即为2^31。
然后遍历文件,如果小于2^31的整数个数大于N/2=2^31,则调整搜索范围为[0, 2^31],反之亦然;然后再对整个文件再遍历一遍,直到得到最后的结果。T(n) = T(n/2) + n,总体的复杂度为o(logn)。
例子:数组[4,2,5,1,3,6,3,7,0,7],假定从3位的整数空间内搜索。第一次的范围为[0,8),遍历过后发现[0,4)范围内的整数个数为5,于是调整为搜索[0,4)范围内的整数。第二次发现[2, 4)范围内的证书为3,大于2,于是调整为[2, 4)。再经过第三次的遍历,找出3为重复出现的整数。
B题
字符串循环移位
比如abcdef 左移三位,则变成defabc
基本还是按照书上的算法,
_rev(0, i)
_rev(i, len)
_rev(0, len)
[cpp] view
plaincopy
static void _res(char *a, int n)
{
int i = 0, j = n - 1;
char t;
while (i < j)
{
t = a[i]; a[i] = a[j]; a[j] = t;
++i; --j;
}
}
char *rever(char *a, int n, int len)
{
int i, j;
if (!a || !n) return a;
_res(a, n);
_res(a + n, len - n);
_res(a, len);
return a;
}
C 题
给定一个单词集合,找出可以相互转换的集合。
比如abc bca cba都可以相互转换。
算法如下
把由于每个单词可以进行唯一性标识,把这个单词按照字母进行排序,可以相互转换的单词都有同样的标识。
这里用C++来写了。
[cpp] view
plaincopy
void gen_label(vector<string> &dict, map<string, vector<string> >&rec)
{
for (int i = 0; i < dict.size(); ++i)
{
string line = dict[i];
sort(line.begin(), line.end());
rec[line].push_back(dict[i]);
}
for (map<string, vector<string> >::iterator iter = rec.begin();
iter != rec.end(); ++iter)
{
copy((iter->second).begin(), (iter->second).end(), ostream_iterator<string>(cout , " "));
cout << endl;
}
}
相关文章推荐
- 编程珠玑(2)第二章学习笔记
- 《编程珠玑》第二章——“啊哈!算法”
- 《编程珠玑》第二章 “杂技算法” 和 “翻转算法” Java语言版
- 编程珠玑第二章的算法实现
- 《编程珠玑》第二章三个问题A---查找40亿个32位整数中缺失的某个整数
- 编程珠玑第二章问题B: n元一维向量旋转问题之java实现
- 编程珠玑-第二章问题A
- 向量旋转算法《编程珠玑》第二章笔记
- 编程珠玑 第二章
- 《编程珠玑》第二章问题C:找出相同的英文单词(单词改变顺序可以互相转化即为相同)
- 《编程珠玑》-第二章:寻找兄弟单词+电话簿功能 算法研究
- 编程珠玑:第二章,3个问题
- 《编程珠玑》习题练习In Python——第二章 啊哈!算法
- 编程珠玑第二章习题2
- 《编程珠玑》读书笔记2------------第二章习题及个人答案
- 《编程珠玑》第二章2.1 二分查找不存在的数
- 编程珠玑第二章问题A,B,C
- 《编程珠玑》 第二章 算法 习题
- 《编程珠玑》第二章 “杂技算法” 和 “翻转算法” C语言实现
- 编程珠玑之第二章questionC: 求变位词问题