您的位置:首页 > 其它

leetcode-4 Median of Two Sorted Arrays

2016-03-25 15:36 453 查看
There are two sorted arrays nums1 and nums2 of
size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

1.常规方法:合并两个数组,排序,找到中间,复杂度O((m+n)log(m+n))。

2.类似于最小的top k问题:O(m+n)
利用类似merge的操作找到中位数,利用两个分别指向A和B数组头的指针去遍历数组,然后统计元素个数,直到找到中位数,此时算法复杂度为O(m+n)。但是该方法会存在无穷多的边界细节问题,而且扩展也不见得正确,这个可从各网页的评论看出,非常不建议大家走这条路。

3.该方法的核心是将原问题转变成一个寻找第k小数的问题(假设两个原序列升序排列)。
(1)首先假设数组A和B的元素个数都大于k/2,我们比较A[k/2-1]和B[k/2-1]两个元素,这两个元素分别表示A的第k/2小的元素和B的第k/2小的元素。这两个元素比较共有三种情况:>、<和=。如果A[k/2-1]<B[k/2-1],这表示A[0]到A[k/2-1]的元素都在A和B合并之后的前k小的元素中。换句话说,A[k/2-1]不可能大于两数组合并之后的第k小值,所以我们可以将其抛弃。

(2)当A[k/2-1]>B[k/2-1]时存在类似的结论。
(3)当A[k/2-1]=B[k/2-1]时,我们已经找到了第k小的数,也即这个相等的元素,我们将其记为m。由于在A和B中分别有k/2-1个元素小于m,所以m即是第k小的数。(这里可能有人会有疑问,如果k为奇数,则m不是中位数。这里是进行了理想化考虑,在实际代码中略有不同,是先求k/2,然后利用k-k/2获得另一个数。)
通过上面的分析,我们即可以采用递归的方式实现寻找第k小的数。此外我们还需要考虑几个边界条件:

    - 如果A或者B为空,则直接返回B[k-1]或者A[k-1];
    - 如果k为1,我们只需要返回A[0]和B[0]中的较小值(k从1开始);
    - 如果A[k/2-1]=B[k/2-1],返回其中一个;

/************************************************************************/

/* method1: O(nlogn) merge                                              */

/************************************************************************/

double findMedianSortedArrays1(int A[], int m, int B[], int n)

{  
int *a=new int[m+n];  
memcpy(a,A,sizeof(int)*m);  
memcpy(a+m,B,sizeof(int)*n);  
sort(a,a+n+m);  
double median = (double) ((n+m)%2? a[(n+m)>>1]:(a[(n+m-1)>>1]+a[(n+m)>>1])/2.0);
delete a;  
return median;

}

/************************************************************************/

/* method2: O(log(m+n))  find topK, always compare half K of each       */

/************************************************************************/

double findKth(int A[], int m, int B[], int n, int k)  // 第k个

{
if(m > n)  // a始终为较小数组
return findKth(B, n, A, m, k);
if(m == 0)
return B[k-1];
if(k == 1)  // 递归最后a,b只剩一个元素时,第k个应该是较小的那个
return min(A[k-1], B[k-1]);
int pa = min(k/2,m), pb = k - pa;  // 经验:除2用移位做更快
if(A[pa-1] < B[pb-1])  // 递归寻找k,O(logk),每次比较来排除掉k个,a中每次取第k/2个(或者当a长度不到k/2时1取最后一位),b取第k-k/2个
return findKth(A+pa, m-pa, B, n, k-pa);  // 已经筛选出pa个,
else if(A[pa-1] > B[pb-1])
return findKth(A, m, B+pb, n-pb, k-pb);  // 已经筛选出pb个
else
return A[pa-1];

}

double findMedianSortedArrays2(int A[], int m, int B[], int n)  // top K

{
if((m+n)%2) // 奇数个; 经验:余2用与操作,&0x1(0x表示16进制)
return findKth(A, m, B, n, (m+n)/2+1);
else
return ( findKth(A, m, B, n, (m+n)/2) + findKth(A, m, B, n, ((m+n)/2+1)) )/2.0;

}

void test_findMedianSortedArrays()

{
int A[6] = {1, 2, 3, 4, 7, 8};
int B[8] = {3, 4, 5, 6, 8, 9, 10, 11};
cout << "findMedianSortedArrays: " << findMedianSortedArrays2(A, 6, B, 8) << endl;

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: