大数据面试一些问题
2017-09-04 14:15
274 查看
1、给你海量数据(大到内存远不能满足计算)的场景,让你统计过滤排序等计算?
http://blog.csdn.net/v_july_v/article/details/7382693
2、关于数据结构和数据算法的面试题?
http://blog.csdn.net/v_july_v/article/details/6870251 或者刷剑指offer
3、数据量达到pb(已经存储到hbase,存储到hbase都很难解决)级别,怎么解决在前端快速的通过一条sql语句就能快速的查询出来结果?
4、怎么解决某一时间段内计算数据量突然变大问题?
5、怎么解决hive查询慢的问题?用presto或者优化hive
6、怎么解决因爬虫数据产生的统计指标虚高问题?
7、集群规模、数据量规模、执行作业时间?
8、如何防止kafka丢失数据?
9、spark的优化?
待续
http://blog.csdn.net/v_july_v/article/details/7382693
2、关于数据结构和数据算法的面试题?
http://blog.csdn.net/v_july_v/article/details/6870251 或者刷剑指offer
3、数据量达到pb(已经存储到hbase,存储到hbase都很难解决)级别,怎么解决在前端快速的通过一条sql语句就能快速的查询出来结果?
4、怎么解决某一时间段内计算数据量突然变大问题?
5、怎么解决hive查询慢的问题?用presto或者优化hive
6、怎么解决因爬虫数据产生的统计指标虚高问题?
7、集群规模、数据量规模、执行作业时间?
8、如何防止kafka丢失数据?
9、spark的优化?
待续
相关文章推荐
- 面试中遇到的一些问题(数据仓库)
- 数据结构复习——链栈的一些操作以及表达式中的括号是否配对问题
- 面试与反面试的一些问题
- [Java面试五]Spring总结以及在面试中的一些问题.
- 用JSON做数据传输格式中的一些问题总结
- 一些面试的问题
- Android ListView的中的数据更新时遇到的一些问题的总结
- 对STM32 HAL库的一些思考(一)SPI通信的数据格式问题
- [Java面试七]Mybatis总结以及在面试中的一些问题.
- ios 平时自己面试遇到的一些问题
- 一些面试可能会遇到的问题 ---- 实时更新中
- 大数据面试编程问题
- 数据挖掘(机器学习)面试--SVM面试常考问题
- MySQL数据传输的一些小问题
- 【总有一些东西要弄清】——说说面试时一系列的CSS问题
- 2015-11-16面试的一些问题 我想记录一下。
- C/C++关于数据类型的一些问题
- C++面试中不怎么注意和比较怪的一些问题
- 整理一些自己的面试中遇到的问题,不定期更新。
- 基本数据类型的包装类型作为参数传递,以及其他引用类型作为参数传递,以及List中值的交换的一些问题