中位数和顺序统计学之求解顺序统计量
2015-11-11 20:16
525 查看
1,顺序统计量介绍
顺序统计量其实就是,给定一组数如何快速有效地找出这组数中第K小的元素。
如找出:4,7,2,9,0,3 中第5小的元素。因为,0<2<3<4<7<9,故可以很容易地找出第5小的元素为7。但是,由于对于排序算法而言,最优的时间复杂度为O(nlogn),这意味着通过排序来查找第K小的元素的时间复杂度至少为O(nlogn),由于只关注一组数中的第K小元素,而不需要关注整个数组中的元素顺序。故有一种方法只需要O(n)的时间复杂度就可以求出顺序统计量。
2,分割算法在求解顺序统计量中的应用 ,分割算法的介绍参考:快速排序中的分割算法实现
经过一次分割之后,比枢轴元素小的元素都在枢轴的左边,比枢轴大的元素都在枢轴的右边。
故此时的枢轴元素就是第 pivot_index - low + 1 小的元素。其中,pivot_index表示枢轴元素的数组下标,low表示数组第1个元素的下标。
那么,当求解第K小元素时,若 K== pivot_index,则一次分割求得的枢轴元素就是第K小的元素了。
若 K > pivot_index,则表明第K小元素应该在枢轴元素的右边,递归在右边查找第K小元素
K <
pivot_index, 则表明第K小元素应该在枢轴元素的左边,递归在左边查找第K小元素
由于分割算法的时间复杂度为O(n),平均来看,查找数组中的第K小元素的时间复杂度为O (n),由于用到了递归,中间结果需要压栈,故空间复杂度最坏情况下为O(n)。
3,求解第K小元素的JAVA实现如下,算法伪代码及详细解释参考《算法导论》
顺序统计量其实就是,给定一组数如何快速有效地找出这组数中第K小的元素。
如找出:4,7,2,9,0,3 中第5小的元素。因为,0<2<3<4<7<9,故可以很容易地找出第5小的元素为7。但是,由于对于排序算法而言,最优的时间复杂度为O(nlogn),这意味着通过排序来查找第K小的元素的时间复杂度至少为O(nlogn),由于只关注一组数中的第K小元素,而不需要关注整个数组中的元素顺序。故有一种方法只需要O(n)的时间复杂度就可以求出顺序统计量。
2,分割算法在求解顺序统计量中的应用 ,分割算法的介绍参考:快速排序中的分割算法实现
经过一次分割之后,比枢轴元素小的元素都在枢轴的左边,比枢轴大的元素都在枢轴的右边。
故此时的枢轴元素就是第 pivot_index - low + 1 小的元素。其中,pivot_index表示枢轴元素的数组下标,low表示数组第1个元素的下标。
那么,当求解第K小元素时,若 K== pivot_index,则一次分割求得的枢轴元素就是第K小的元素了。
若 K > pivot_index,则表明第K小元素应该在枢轴元素的右边,递归在右边查找第K小元素
K <
pivot_index, 则表明第K小元素应该在枢轴元素的左边,递归在左边查找第K小元素
由于分割算法的时间复杂度为O(n),平均来看,查找数组中的第K小元素的时间复杂度为O (n),由于用到了递归,中间结果需要压栈,故空间复杂度最坏情况下为O(n)。
3,求解第K小元素的JAVA实现如下,算法伪代码及详细解释参考《算法导论》
import java.util.Random; public class RandomSelect { /* * choose the k th small element in array * @return the k th small element's value */ public int randomSelect(int[] arr, int low, int high, int i){ if(i > arr.length || arr.length == 0) return -1;// -1 means illegal params if(low == high) return arr[low];//only one element in array // int pivot_index = randomPartition(arr, low, high); int pivot_index = partition(arr, low, high); int k = pivot_index - low + 1;//k 表示数组中 第 k 小的元素(第1小的元素为最小元素) /* * i==k 意味着待求解的第i小元素就是上面求解的枢轴元素 * i<k 意味着第i小元素在第k小元素的左边,那么继续在左边递归查找第i小元素 * i>k意味着第i小元素在第k小元素的右边,继续在右边递归查找第i-k小元素,再加上前面的排序的k个元素,即可找到第i小的元素 */ if(i == k) return arr[pivot_index]; else if(i < k) return randomSelect(arr, low, pivot_index - 1, i); else return randomSelect(arr, pivot_index + 1, high, i - k);//i-k } /* * split array * this method always use the last elements as pivot. * when the method finished, the left elements of array smaller than pivot. * and the right elements of array larger than pivot. * @return the pivot element's index in array */ public int partition(int arr[], int low, int high) { int pivot = arr[high]; int i = low - 1; for (int j = low; j < high; j++) { if (arr[j] <= pivot) { i++; swap(arr, i, j); } } swap(arr, i + 1, high); return i + 1; } /* * create a random pivot and use it to partition array */ public int randomPartition(int[] arr, int low, int high){ int rand = getRandom(low, high); swap(arr, arr[rand], arr[high]);//arr[high] is a random and will be as pivot return partition(arr, low, high); } /* * return a random between min and max----[min, max] */ private int getRandom(int min, int max){ Random random = new Random(); return random.nextInt(max + 1) % (max-min+1) + min; } /* * switch two elements of arry * @param int[] arr an array for switch * @param int i, j index of array * */ private void swap(int[] arr, int i, int j){ int tmp = arr[i]; arr[i] = arr[j]; arr[j] = tmp; } }
相关文章推荐
- 动易2006序列号破解算法公布
- Ruby实现的矩阵连乘算法
- C#插入法排序算法实例分析
- Lua教程(七):数据结构详解
- 解析从源码分析常见的基于Array的数据结构动态扩容机制的详解
- 超大数据量存储常用数据库分表分库算法总结
- C#数据结构与算法揭秘二
- C#冒泡法排序算法实例分析
- C#数据结构揭秘一
- 算法练习之从String.indexOf的模拟实现开始
- C#算法之关于大牛生小牛的问题
- C#实现的算24点游戏算法实例分析
- c语言实现的带通配符匹配算法
- 数据结构之Treap详解
- 浅析STL中的常用算法
- 算法之排列算法与组合算法详解
- C++实现一维向量旋转算法
- Ruby实现的合并排序算法
- C#折半插入排序算法实现方法
- 基于C++实现的各种内部排序算法汇总