您的位置:首页 > 运维架构

hadoop入门教程-hadoop是什么

2016-03-31 21:39 218 查看
随着互联网的发展,大数据时代越来越受到关注,所以最近在看一些关于大数据的书,下面是我在读书中的心得体会:

          hadoop是一个开源的大数据分析软件,或者说编程模式。它是通过分布式的方式处理大数据的,因为开元的原因现在很多的企业或多或少的在运用hadoop的技术来解决一些大数据的问题,在数据仓库方面hadoop是非常强大的。但在数据集市以及实时的分析展现层面,hadoop也有着明显的不足,现在一个比较好的解决方案是架设hadoop的数据仓库而数据集市以及实时分析展现层面使用永洪科技的大数据产品,能够很好地解决hadoop的分时间长以及其他的问题。



从整体上来讲,hadoop有如下两个核心分类:



与关系型数据库对比如下:



主要包括如下几个子项目:



         总的来说Hadoop适合应用于大数据存储和大数据分析的应用,适合于服务器几千台到几万台的集群运行,支持PB级的存储容量。

        Hadoop典型应用有:搜索、日志处理、推荐系统、数据分析、视频图像分析、数据保存等。

        但要知道,Hadoop的使用范围远小于SQL或Python之类的脚本语言,所以不要盲目使用Hadoop,但是对于一个IT的热爱者,我们需要这份热情去了解和认识一个新技术,新名词!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  大数据 hadoop