leetcode-4 Median of Two Sorted Arrays
2016-03-25 15:36
453 查看
There are two sorted arrays nums1 and nums2 of
size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).
1.常规方法:合并两个数组,排序,找到中间,复杂度O((m+n)log(m+n))。
2.类似于最小的top k问题:O(m+n)
利用类似merge的操作找到中位数,利用两个分别指向A和B数组头的指针去遍历数组,然后统计元素个数,直到找到中位数,此时算法复杂度为O(m+n)。但是该方法会存在无穷多的边界细节问题,而且扩展也不见得正确,这个可从各网页的评论看出,非常不建议大家走这条路。
3.该方法的核心是将原问题转变成一个寻找第k小数的问题(假设两个原序列升序排列)。
(1)首先假设数组A和B的元素个数都大于k/2,我们比较A[k/2-1]和B[k/2-1]两个元素,这两个元素分别表示A的第k/2小的元素和B的第k/2小的元素。这两个元素比较共有三种情况:>、<和=。如果A[k/2-1]<B[k/2-1],这表示A[0]到A[k/2-1]的元素都在A和B合并之后的前k小的元素中。换句话说,A[k/2-1]不可能大于两数组合并之后的第k小值,所以我们可以将其抛弃。
(2)当A[k/2-1]>B[k/2-1]时存在类似的结论。
(3)当A[k/2-1]=B[k/2-1]时,我们已经找到了第k小的数,也即这个相等的元素,我们将其记为m。由于在A和B中分别有k/2-1个元素小于m,所以m即是第k小的数。(这里可能有人会有疑问,如果k为奇数,则m不是中位数。这里是进行了理想化考虑,在实际代码中略有不同,是先求k/2,然后利用k-k/2获得另一个数。)
通过上面的分析,我们即可以采用递归的方式实现寻找第k小的数。此外我们还需要考虑几个边界条件:
- 如果A或者B为空,则直接返回B[k-1]或者A[k-1];
- 如果k为1,我们只需要返回A[0]和B[0]中的较小值(k从1开始);
- 如果A[k/2-1]=B[k/2-1],返回其中一个;
/************************************************************************/
/* method1: O(nlogn) merge */
/************************************************************************/
double findMedianSortedArrays1(int A[], int m, int B[], int n)
{
int *a=new int[m+n];
memcpy(a,A,sizeof(int)*m);
memcpy(a+m,B,sizeof(int)*n);
sort(a,a+n+m);
double median = (double) ((n+m)%2? a[(n+m)>>1]:(a[(n+m-1)>>1]+a[(n+m)>>1])/2.0);
delete a;
return median;
}
/************************************************************************/
/* method2: O(log(m+n)) find topK, always compare half K of each */
/************************************************************************/
double findKth(int A[], int m, int B[], int n, int k) // 第k个
{
if(m > n) // a始终为较小数组
return findKth(B, n, A, m, k);
if(m == 0)
return B[k-1];
if(k == 1) // 递归最后a,b只剩一个元素时,第k个应该是较小的那个
return min(A[k-1], B[k-1]);
int pa = min(k/2,m), pb = k - pa; // 经验:除2用移位做更快
if(A[pa-1] < B[pb-1]) // 递归寻找k,O(logk),每次比较来排除掉k个,a中每次取第k/2个(或者当a长度不到k/2时1取最后一位),b取第k-k/2个
return findKth(A+pa, m-pa, B, n, k-pa); // 已经筛选出pa个,
else if(A[pa-1] > B[pb-1])
return findKth(A, m, B+pb, n-pb, k-pb); // 已经筛选出pb个
else
return A[pa-1];
}
double findMedianSortedArrays2(int A[], int m, int B[], int n) // top K
{
if((m+n)%2) // 奇数个; 经验:余2用与操作,&0x1(0x表示16进制)
return findKth(A, m, B, n, (m+n)/2+1);
else
return ( findKth(A, m, B, n, (m+n)/2) + findKth(A, m, B, n, ((m+n)/2+1)) )/2.0;
}
void test_findMedianSortedArrays()
{
int A[6] = {1, 2, 3, 4, 7, 8};
int B[8] = {3, 4, 5, 6, 8, 9, 10, 11};
cout << "findMedianSortedArrays: " << findMedianSortedArrays2(A, 6, B, 8) << endl;
}
size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).
1.常规方法:合并两个数组,排序,找到中间,复杂度O((m+n)log(m+n))。
2.类似于最小的top k问题:O(m+n)
利用类似merge的操作找到中位数,利用两个分别指向A和B数组头的指针去遍历数组,然后统计元素个数,直到找到中位数,此时算法复杂度为O(m+n)。但是该方法会存在无穷多的边界细节问题,而且扩展也不见得正确,这个可从各网页的评论看出,非常不建议大家走这条路。
3.该方法的核心是将原问题转变成一个寻找第k小数的问题(假设两个原序列升序排列)。
(1)首先假设数组A和B的元素个数都大于k/2,我们比较A[k/2-1]和B[k/2-1]两个元素,这两个元素分别表示A的第k/2小的元素和B的第k/2小的元素。这两个元素比较共有三种情况:>、<和=。如果A[k/2-1]<B[k/2-1],这表示A[0]到A[k/2-1]的元素都在A和B合并之后的前k小的元素中。换句话说,A[k/2-1]不可能大于两数组合并之后的第k小值,所以我们可以将其抛弃。
(2)当A[k/2-1]>B[k/2-1]时存在类似的结论。
(3)当A[k/2-1]=B[k/2-1]时,我们已经找到了第k小的数,也即这个相等的元素,我们将其记为m。由于在A和B中分别有k/2-1个元素小于m,所以m即是第k小的数。(这里可能有人会有疑问,如果k为奇数,则m不是中位数。这里是进行了理想化考虑,在实际代码中略有不同,是先求k/2,然后利用k-k/2获得另一个数。)
通过上面的分析,我们即可以采用递归的方式实现寻找第k小的数。此外我们还需要考虑几个边界条件:
- 如果A或者B为空,则直接返回B[k-1]或者A[k-1];
- 如果k为1,我们只需要返回A[0]和B[0]中的较小值(k从1开始);
- 如果A[k/2-1]=B[k/2-1],返回其中一个;
/************************************************************************/
/* method1: O(nlogn) merge */
/************************************************************************/
double findMedianSortedArrays1(int A[], int m, int B[], int n)
{
int *a=new int[m+n];
memcpy(a,A,sizeof(int)*m);
memcpy(a+m,B,sizeof(int)*n);
sort(a,a+n+m);
double median = (double) ((n+m)%2? a[(n+m)>>1]:(a[(n+m-1)>>1]+a[(n+m)>>1])/2.0);
delete a;
return median;
}
/************************************************************************/
/* method2: O(log(m+n)) find topK, always compare half K of each */
/************************************************************************/
double findKth(int A[], int m, int B[], int n, int k) // 第k个
{
if(m > n) // a始终为较小数组
return findKth(B, n, A, m, k);
if(m == 0)
return B[k-1];
if(k == 1) // 递归最后a,b只剩一个元素时,第k个应该是较小的那个
return min(A[k-1], B[k-1]);
int pa = min(k/2,m), pb = k - pa; // 经验:除2用移位做更快
if(A[pa-1] < B[pb-1]) // 递归寻找k,O(logk),每次比较来排除掉k个,a中每次取第k/2个(或者当a长度不到k/2时1取最后一位),b取第k-k/2个
return findKth(A+pa, m-pa, B, n, k-pa); // 已经筛选出pa个,
else if(A[pa-1] > B[pb-1])
return findKth(A, m, B+pb, n-pb, k-pb); // 已经筛选出pb个
else
return A[pa-1];
}
double findMedianSortedArrays2(int A[], int m, int B[], int n) // top K
{
if((m+n)%2) // 奇数个; 经验:余2用与操作,&0x1(0x表示16进制)
return findKth(A, m, B, n, (m+n)/2+1);
else
return ( findKth(A, m, B, n, (m+n)/2) + findKth(A, m, B, n, ((m+n)/2+1)) )/2.0;
}
void test_findMedianSortedArrays()
{
int A[6] = {1, 2, 3, 4, 7, 8};
int B[8] = {3, 4, 5, 6, 8, 9, 10, 11};
cout << "findMedianSortedArrays: " << findMedianSortedArrays2(A, 6, B, 8) << endl;
}
相关文章推荐
- bootstrap-datetimepicker如何只显示到日期
- 操作系统实验二作业调度模拟程序
- MySQL 中的 base64 函数
- 机器学习基础(十九)—— Trick
- 最小生成树-Kruscal-POJ 1258 Agri-Net
- 腾讯游戏运维
- Software Security
- 《Python数据分析基础教程:Numpy学习指南》- 速记 - 第四章
- nodejs nodejs模块使用及简单的示例
- JMeter学习(十)内存溢出解决方法
- Java代码规范
- FragmentPagerAdapter刷新fragment
- MFC六大核心机制之三:动态创建
- 把excel中的内容搬迁到PPT中的VBA编程
- 探讨对理想团队模式的构建的设想以及对软件流程的理解
- hibernate使用二级缓存ehcahe的配置
- Mssql存储过程大杂烩
- MFC-ListBox控件用法
- 278. First Bad Version
- sublime text 3解放鼠标的快捷键总结