概率数据结构
2016-07-25 22:57
253 查看
https://highlyscalable.wordpress.com/2012/05/01/probabilistic-structures-web-analytics-data-mining/
1 统计不重复的基数或者数量,例如 hyperloglog数据结构,统计一年的不重复ip总数
2 统计topk问题Heavy Hitters,top20的慢查询
3 范围查询,查找出排名400-500的消费者
4 Membership Query,是否包含该条数据,例如布隆过滤器 在HBase中,类似于configServer判断数据是否存在于storefile中
1 统计不重复的基数或者数量,例如 hyperloglog数据结构,统计一年的不重复ip总数
2 统计topk问题Heavy Hitters,top20的慢查询
3 范围查询,查找出排名400-500的消费者
4 Membership Query,是否包含该条数据,例如布隆过滤器 在HBase中,类似于configServer判断数据是否存在于storefile中
相关文章推荐
- sdut oj2122 数据结构实验之链表七:单链表中重复元素的删除
- sdut oj2121 数据结构实验之链表六:有序链表的建立
- 数据结构实验之栈七:出栈序列判定
- 数据结构之字典序全排列
- 数据结构 -- 红黑树
- 算法和数据结构的实际应用
- Redis中基本数据结构
- 数据结构 -- 平衡二叉树AVL
- 数据结构之线段树
- 数据结构学习工具总结
- 数据结构 -- 搜索二叉树
- 数据结构与算法JavaScript - 队列
- 线性表之顺序表
- 数据结构与算法JavaScript - 栈
- 挑剔数列和递归算法
- 二叉树
- 数据结构--------------AVLTree
- 数据结构 在单链表和双链表中删除倒数第K个节点
- 数据结构之对顺序栈的操作(C语言版)
- 数据结构之对线性表的操作(C语言版)