题目:海量数据处理,40亿个不重复的unsigned int的整数,如何判断某数是否在其中?
2015-03-14 18:08
447 查看
给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
速度相当的快,应该是在小于o(n)的时间内就可以解决问题。但是rand()产生的随机数范围有限制,可以想想其他办法产生随机数。可以看到,所用到的内存很小,而且程序反应速度也很快。这种方法是基于要寻找数的本身特性。也可以成为bit magic。这就是比特位的强大魅力所在。首先,判断所要寻找数字x的最高比特位是1还是0,假设为1,这样可以根据40亿个数的最高位是1还是0进行操作,是0的直接舍去,是1的保留,可以看到题目所说,40亿个数都是不重复的,这样可以保证最高位1和0分布是均匀的,剩下的就应该是20个数,然后再取x的次高位,根据是1还是0将剩下的整数分类,这样经过31一趟分类之后,剩下数字的前31位都和要寻找的数字的高31位一样,那么,可以直接寻找剩下的数字中是否有我们要寻找的数字。为了节省时间就没有弄40亿个数字。最重要的是明白原理就好。[cpp]
view plaincopy
#include<iostream>
#include<string.h>
#include<ctime>
using namespace std;
#define N 1000000
// i 从 0 到 31 分别代表最高位到最低位
int is_bit_one(int n, int i) {
return n & (1 << (32 - i - 1));
}
void swap_path(char **a, char **b) {
char *temp;
temp = *a;
*a = *b;
*b = temp;
}
void main() {
FILE *fin;
FILE *fout;
char *source = "source.txt";
char *result = "result.txt";
if((fin = fopen(source, "w")) == NULL) {
cout << "open source file failed!" << endl;
return;
}
int i = 0;
int num = 0;
int find_num = 8;
srand((unsigned)time(NULL));
while(i < N) {
num = rand() % N;
fprintf(fin, "%d ", num);
i++;
}
fclose(fin);
for(i = 0; i < 32; i++) {
fin = fopen(source, "r");
fout = fopen(result, "w");
if(is_bit_one(find_num, i)) {
while(fscanf(fin, "%d", &num) != EOF) {
if(num >= 0 &&is_bit_one(num, i)) {
fprintf(fout, "%d " , num);
}
}
} else {
while(fscanf(fin, "%d", &num) != EOF) {
if(!is_bit_one(num, i) && num >= 0) {
fprintf(fout, "%d " , num);
}
}
}
fclose(fin);
fclose(fout);
swap_path(&source, &result);
}
}
相关文章推荐
- 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 腾讯面试题 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
- 哈希变形—位图(给定40亿个不重复的无符号数整数,没排过序,给一个无符号整数,如何快速判断一个数是否在这40亿个数中)
- 面试题:给40亿个不重复的无符号整数,没排过序,给一个无符号整数如何快速判断这个数是否在这40亿个数中
- 如何判断一个整数数组中是否有重复元素
- 如何判断一个整数数组中是否有重复元素?要求时间复杂度O(n),空间复杂度O(1)
- 2个二叉树A、B,树的每个节点上都有一个整数值。如何判断A与B是否其中一个是另一个的子树?
- 给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在这40亿个数中。 【腾讯】
- 如何判断一个整数数组中是否有重复元素?要求时间复杂度O(n),空间复杂度O(1)
- 如何判断一个整数数组中是否有重复元素?要求时间复杂度O(n),空间复杂度O(1)
- java中如何判断一个数是否为正整数(多种种方式比较有意思)对时间处理也可以
- 一个数组下标从0到n,元素为从0到n的整数,判断其中是否有重复元素。
- 如何判断一个整数数组中是否有重复元素?要求时间复杂度O(n),空间复杂度O(1)
- 给40亿个不重复的unsigned int的数,没排序,然后再给一个数,如何快速间断这个数是否在那40亿个数中
- 一个数组,下标从0到n,元素为从0到n的整数。判断其中是否有重复元素