浅谈hadoop(三)——hadoop简介
2016-11-28 15:42
204 查看
浅谈hadoop(三)——hadoop简介
本文翻译来源hadoop官网:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html#The_File_System_NamespaceThe file system namespace
hdfs采用一种传统的等级的文件组织方式。用户或者应用程序能够在文件夹中创建文件和文件夹。文件系统的命名空间和现在的操作系统的文件系统命名空间类似。可以创建或者删除文件、把文件从一个文件夹移动到另一个文件夹中、重命名文件。hdfs支持 user
quotas 和 access
permissions。hdfs不支持硬连接和软连接。但是,hdfs没有排除实现这些特性。
namenode管理文件系统的命名空间,文件系统的任何变化和属性,都会记录在namenode中。应用程序能够设置文件的副本数量,这些副本数量是由namenode管理的。这些副本的数量叫做这个文件的副本因子。副本因子在namenode中被排序。
data replication
hdfs被设计成可靠的存储集群中的大量文件。每个文件被存储成有序的块,这些块的目的是为了容错。每个文件能够设置块大小和副本因子。
除去最后一个块,所有块的大小都相同。但是,有了动态块长度和水平同步后,用户在创建一个块的时候不需要填满上个文件的最后一个块到指定长度。
应用程序能够指定副本因子的大小。副本因子能够在文件创建时指定,创建完成后也能够修改。在hdfs中的文件只能写一次(附加和删除除外),而且任何时候只能有一个写。
namenode负责块的副本,它周期的从集群中的datanode收到heartbeat和blockreport。收到heartbeat表明datanode可用。blockreport中包含了datanode中的所有block信息。
相关文章推荐
- 浅谈Hadoop(二)——hadoop简介
- 浅谈hadoop(四)——hadoop简介
- 浅谈hadoop(五)——hadoop简介 文件系统元数据的持久化
- 浅谈Hadoop(一)——hadoop简介
- Hadoop中RPC机制简介
- Hadoop到底能做什么?怎么用hadoop? 与 R语言简介 以及 MapReduce
- Hadoop简介-yellowcong
- 浅谈大数据和hadoop家族
- Hadoop简介
- hadoop基础------虚拟机(一)---虚拟机简介
- [转载] Hadoop/Hive简介
- Hadoop生态圈以及各组成部分的简介
- Hadoop入门 -- 简介,安装,示例
- Hadoop入门 -- 简介,安装,示例
- hadoop的成员项目简介
- hadoop简介
- hadoop初始与简介
- hadoop简介
- hadoop——简介与安装
- 【转】浅谈大数据(hadoop)和移动开发(Android、IOS)开发前景