您的位置:首页 > 运维架构

Hadoop概述

2018-01-18 15:58 190 查看
1.什么是hadoop?

hadoop是一个分布式系统基础架构,由apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。

它包括三部分:HDFS,YARN,和MapReduce。

HDFS:Hadoop分布式文件系统

YARN:任务调度和集群资源管理框架。

MapReduce:能够基于YARN并行的处理大规模的数据集。

2.狭义hadoop和广义的hadoop

狭义hadoop:是一个适合大数据分布式存储(HDFS)、分布式计算(MR)和资源调度(YARN)平台。

广义hadoop:指hadoop生态系统。hadoop是其中最重要最基础的一个部分。生态系统中的每一个子系统只能解决某一个领域的特定问题域。

  hadoop生态系统:
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: