您的位置:首页 > 理论基础 > 数据结构算法

概率数据结构

2016-07-25 22:57 253 查看
https://highlyscalable.wordpress.com/2012/05/01/probabilistic-structures-web-analytics-data-mining/

1 统计不重复的基数或者数量,例如 hyperloglog数据结构,统计一年的不重复ip总数

2 统计topk问题Heavy Hitters,top20的慢查询

3 范围查询,查找出排名400-500的消费者

4 Membership Query,是否包含该条数据,例如布隆过滤器 在HBase中,类似于configServer判断数据是否存在于storefile中
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: