大量数据的情况下,找出最热门的TOP N 词汇
2015-04-29 19:41
246 查看
有一个表维护的是热门词汇信息,表结构为(词汇,查看次数)。
例如:
旅游,7493923
买车,5939274
二手房,2047902
… …
数据量十分大,是以亿为单位的数量级。
现在要求最热门的N个词汇(1<=N<=1000),并写出程序。
个人觉得题目不够完整,比如数据结构是什么样的呀。当然也可以自己定义,但是想想1个小时内要完成4题,而这种题目又不是很容易马上写出代码来。能力有限,最后我写了算法的思路。
例如:
旅游,7493923
买车,5939274
二手房,2047902
… …
数据量十分大,是以亿为单位的数量级。
现在要求最热门的N个词汇(1<=N<=1000),并写出程序。
个人觉得题目不够完整,比如数据结构是什么样的呀。当然也可以自己定义,但是想想1个小时内要完成4题,而这种题目又不是很容易马上写出代码来。能力有限,最后我写了算法的思路。
相关文章推荐
- 大量数据中选择top-K有序数据归总分析
- 【代码】PHP 分析查询MySQL大量数据的内存占用情况
- 大量数据并发的情况下 ,不用自增列 怎样设置主键 (转载自IT公司面试手册)
- Mongo在存储大量数据时,有数据存储不上的情况?
- Mongo在存储大量数据时,有数据存储不上的情况?
- SQL疑难杂症【5 】大量数据查询的时候要考虑结果为空的情况
- 使用mongoVUE删除大量数据的情况下失效问题
- PHP大量数据循环时内存耗尽问题的解决方案(适用于导出大量数据时内存耗尽情况)
- 大量数据情况下单线程插入和多线程(高并发)insert数据库的性能测试
- 大量数据并发的情况下 ,不用自增列 怎样设置主键
- mysql 大量数据插入(可用于数据添加字段不能添加的情况,因为会copy临时表。这样可以手动分批处理)
- TOP-K排序算法,从海量不重复数据中找出最大/小的K个数
- 大量数据并发的情况下 int主键 不设自增时取单号
- 淘宝TOP API 缓存实战 解决API频率过高,页面空白,调用不到数据等情况
- 大数据量情况下求top N的问题
- 如何在有限的内存的情况下,找到大量数据中重复查询次数最多的语句
- PHP uniqid()函数可用于生成不重复的唯一标识符,该函数基于微秒级当前时间戳。在高并发或者间隔时长极短(如循环代码)的情况下,会出现大量重复数据。即使使用了第二个参数,也会重复,最好的方案是结
- 从大量的数据中找出若干个最大或者最小的数据
- 大量数据情况下单线程插入和多线程insert数据库的性能测试
- HIVE 在执行大量数据JOIN的时候,容易产生内存不足的情况