您的位置:首页 > 运维架构

Hadoop Tips

2013-10-31 10:44 323 查看
大家都在hadoop,但是对它可能只见树木,不见森林。仍然处于迷茫,甚至在 学习的时候,也不知道自己在学什么知识,这个知识在整个hadoop体系中的是什么位置。现在利用hadoop图,为大家整体讲解hadoop.

1. 这一切,都起源自Web数据爆炸时代的来临

2. 数据抓取系统 - Nutch

3. 海量数据怎么存,当然是用分布式文件系统 - HDFS

4. 数据怎么用呢,分析,处理

5. MapReduce框架,让你编写代码来实现对大数据的分析工作

6. 非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe

7. 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 - Hiho, sqoop

8. MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql

9. 让你的数据可见 - drilldown, Intellicus

10. 用高级语言管理你的任务流 – oozie, Cascading

11. Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia

12. 数据序列化处理与任务调度 – Avro, Zookeeper

13. 更多构建在Hadoop上层的服务 – Mahout, Elastic map Reduce

14. OLTP存储系统 – Hbase
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: