您的位置：首页 > 理论基础 > 数据结构算法

中位数和顺序统计学之求解顺序统计量

2015-11-11 20:16 525 查看

1，顺序统计量介绍

顺序统计量其实就是，给定一组数如何快速有效地找出这组数中第K小的元素。

如找出：4，7，2，9，0，3 中第5小的元素。因为,0<2<3<4<7<9，故可以很容易地找出第5小的元素为7。但是，由于对于排序算法而言，最优的时间复杂度为O(nlogn)，这意味着通过排序来查找第K小的元素的时间复杂度至少为O(nlogn)，由于只关注一组数中的第K小元素，而不需要关注整个数组中的元素顺序。故有一种方法只需要O(n)的时间复杂度就可以求出顺序统计量。

2，分割算法在求解顺序统计量中的应用，分割算法的介绍参考：快速排序中的分割算法实现

经过一次分割之后，比枢轴元素小的元素都在枢轴的左边，比枢轴大的元素都在枢轴的右边。

故此时的枢轴元素就是第 pivot_index - low + 1 小的元素。其中，pivot_index表示枢轴元素的数组下标，low表示数组第1个元素的下标。

那么，当求解第K小元素时，若 K== pivot_index，则一次分割求得的枢轴元素就是第K小的元素了。

若 K > pivot_index，则表明第K小元素应该在枢轴元素的右边，递归在右边查找第K小元素

K <
pivot_index, 则表明第K小元素应该在枢轴元素的左边，递归在左边查找第K小元素

由于分割算法的时间复杂度为O(n)，平均来看，查找数组中的第K小元素的时间复杂度为O (n)，由于用到了递归，中间结果需要压栈，故空间复杂度最坏情况下为O(n)。

3，求解第K小元素的JAVA实现如下，算法伪代码及详细解释参考《算法导论》

import java.util.Random;

public class RandomSelect {
/*
* choose the k th small element in array
* @return the k th small element's value
*/
public int randomSelect(int[] arr, int low, int high, int i){
if(i > arr.length || arr.length == 0)
return -1;// -1 means illegal params

if(low == high)
return arr[low];//only one element in array

//		int pivot_index = randomPartition(arr, low, high);
int pivot_index = partition(arr, low, high);
int k = pivot_index - low + 1;//k 表示数组中 第 k 小的元素(第1小的元素为最小元素)

/*
* i==k 意味着待求解的第i小元素就是上面求解的枢轴元素
* i<k 意味着第i小元素在第k小元素的左边,那么继续在左边递归查找第i小元素
* i>k意味着第i小元素在第k小元素的右边,继续在右边递归查找第i-k小元素,再加上前面的排序的k个元素，即可找到第i小的元素
*/
if(i == k)
return arr[pivot_index];
else if(i < k)
return randomSelect(arr, low, pivot_index - 1, i);
else
return randomSelect(arr, pivot_index + 1, high, i - k);//i-k
}

/*
* split array
* this method always use the last elements as pivot.
* when the method finished, the left elements of array smaller than pivot.
* and the right elements of array larger than pivot.
* @return  the pivot element's index in array
*/
public int partition(int arr[], int low, int high) {
int pivot = arr[high];
int i = low - 1;
for (int j = low; j < high; j++) {
if (arr[j] <= pivot) {
i++;
swap(arr, i, j);
}
}
swap(arr, i + 1, high);
return i + 1;
}

/*
* create a random pivot and use it to partition array
*/
public int randomPartition(int[] arr, int low, int high){
int rand = getRandom(low, high);
swap(arr, arr[rand], arr[high]);//arr[high] is a random and will be as pivot
return partition(arr, low, high);
}

/*
* return a random between min and max----[min, max]
*/
private int getRandom(int min, int max){
Random random = new Random();
return  random.nextInt(max + 1) % (max-min+1) + min;
}

/*
* switch two elements of arry
* @param int[] arr an array for switch
* @param int i, j index of array
*
*/
private void swap(int[] arr, int i, int j){
int tmp = arr[i];
arr[i] = arr[j];
arr[j] = tmp;
}
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 算法数据结构顺序统计量中位数

相关文章推荐

新的分享

章节导航