您的位置:首页 > 运维架构 > Shell

hdfs shell

2014-03-20 00:14 323 查看
 

HDFS(Hadoop Distributed Filesystem)提供一个类似于Unix Shell的命令接口FSShell,用于client和HDFS进行数据交互。调用FSShell命令的方式:

$HADOOP_HOME/bin/hadoop fs <args>

其中,$ HAOOP_HOME指hadoop所在的目录。所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme是可选的,未加指定就会使用配置中指定的默认scheme。一个HDFS文件或目录比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child,或者更简单的/parent/child(假设你配置文件中的默认值是namenode:namenodeport)。命令的出错信息会输出到stderr,其他信息输出到stdout。

下面是对常用命令的详细介绍(本文档只适用于Hadoop-v2版本,其他版本的命令使用及返回值存在差异):

• mkdir

• ls

• lsr

• put

• copyFromLocal

• moveFromLocal

• get

• copyToLocal

• rm

• rmr

• test

• du

• dus

• mv

• cp

• cat

• tail

• touchz

• setrep

• stat

• getmerge

• text

• chmod

• chown

• chgrp

• moveToLocal

1.1.1 mkdir

使用方法:hadoop fs -mkdir <paths>

接受路径指定的uri作为参数,创建这些目录。其行为类似于Unix的mkdir -p,它会创建路径中的各级父目录。

示例:

• hadoop fs -mkdir /user/hadoop/dir1 /user/hadoop/dir2

• hadoop fs -mkdir hdfs://host1:port1/user/hadoop/dir hdfs://host2:port2/user/hadoop/dir

返回值:

成功返回0,失败返回255(目录已存在; 失去与Namenode的连接或Namenode处于安全模式返回)。

1.1.2 ls

使用方法:hadoop fs -ls <args>

如果是文件,则按照如下格式返回文件信息:

权限 副本数 用户ID 组ID 文件大小 修改日期 修改时间 文件名

如果是目录,则返回它直接子文件的一个列表,就像在Unix中一样。目录返回列表的信息如下:

权限 副本数 用户ID 组ID 0 修改日期 修改时间 目录名

示例:

• hadoop fs -ls /user/hadoop/file1 /user/hadoop/file2 …

返回值:

成功返回0,失败返回255(文件或目录不存在; 失去与Namenode的连接)。

1.1.3 lsr

使用方法:hadoop fs -lsr <args>

ls命令的递归版本。类似于Unix中的ls -R。

1.1.4 put

使用方法:hadoop fs -put <localsrc> ... <dst>

从本地文件系统中复制单个或多个源路径到目标文件系统;也支持从标准输入中读取输入写入目标文件系统。

• hadoop fs -put localfile /user/hadoop/hadoopfile

• hadoop fs -put localfile1 localdir1 /user/hadoop/hadoopdir

• hadoop fs -put localfile hdfs://host:port/hadoop/hadoopfile

• hadoop fs -put - hdfs://host:port/hadoop/hadoopfile (从标准输入中读取输入)

返回值:

成功返回0,失败返回255(源文件不存在或目标文件已存在;失去与Namenode的连接或Namenode处于安全模式返回)。

1.1.5 copyFromLocal

使用方法:hadoop fs -copyFromLocal <localsrc> ... <dst>

和put命令相似。

1.1.6 moveFromLocal

使用方法:dfs -moveFromLocal <localsrc> ... <dst>

除了拷贝完成源路径将被删除外,和put和copyFromLocal命令相似。

1.1.7 get

使用方法:hadoop fs -get [-ignorecrc] [-crc] <src> <localdst>

复制文件到本地文件系统。可用-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。

示例:

• hadoop fs -get /user/hadoop/file localfile

• hadoop fs -get hdfs://host:port/user/hadoop/file localfile

返回值:

成功返回0,失败返回255(源文件不存在或目标文件已存在;失去与Namenode的连接)。

1.1.8 copyToLocal

使用方法:hadoop fs -copyToLocal [-ignorecrc] [-crc] <src> <localdst>

和get命令类似。

1.1.9 rm

使用方法:hadoop fs -rm URI [URI …]

删除指定的文件。只删除非空目录和文件。请参考rmr命令了解递归删除。

示例:

• hadoop fs -rm hdfs://host:port/file /user/hadoop/emptydir

返回值:

成功返回0,失败返回255(文件不存在; 删除目录;失去与Namenode的连接)。

1.1.10 rmr

使用方法:hadoop fs -rmr URI [URI …]

删除的递归版本。

示例:

• hadoop fs -rmr /user/hadoop/dir

• hadoop fs -rmr hdfs://host:port/user/hadoop/dir

返回值:

成功返回0,失败返回255(文件或目录不存在;失去与Namenode的连接)。

1.1.11 test

使用方法:hadoop fs -test -[ezd] URI

选项:

-e 检查文件是否存在。如果存在则返回0;否则返回1。

-z 检查文件是否是0字节。如果是则返回0;否则返回1。

-d 检查路径是否是目录。如果是则返回0;否则返回1。

失去与Namenode的连接返回255。

示例:

• hadoop fs -test -e filename

1.1.12 du

使用方法:hadoop fs -du URI [URI …]

显示目录中所有文件的大小,或者当只指定一个文件时,显示此文件的大小。

示例:

hadoop fs -du /user/hadoop/dir1 /user/hadoop/file1 hdfs://host:port/user/hadoop/dir1

返回值:

成功返回0,失败返回255(文件或目录不存在;失去与Namenode的连接)。

1.1.13 dus

使用方法:hadoop fs -dus URI [URI …]

显示目录中所有文件的总大小,而不会分别显示出目录中各个文件的大小;当只指定一个文件时,显示此文件的大小。

1.1.14 touchz

使用方法:hadoop fs -touchz URI [URI …]

创建一个0字节的空文件;如果文件已存在则修改相应的mtime。

示例:

• hadoop -touchz pathname

返回值:

成功返回0,失败返回255(失去与Namenode的连接或Namenode处于安全模式)。

1.1.15 mv

使用方法:hadoop fs -mv URI [URI …] <dest>

将文件从源路径移动到目标路径。该命令允许有多个源路径,此时目标路径必须是一个目录。不允许在不同的文件系统间移动文件。

示例:

• hadoop fs -mv /user/hadoop/file1 /user/hadoop/file2

• hadoop fs -mv hdfs://host:port/file1 hdfs://host:port/file2 hdfs://host:port/file3 hdfs://host:port/dir1

返回值:

成功返回0,失败返回255(源路径不存在或目标路径已存在;失去与Namenode的连接或Namenode处于安全模式)。

1.1.16 cp

使用方法:hadoop fs -cp URI [URI …] <dest>

将文件从源路径复制到目标路径。该命令允许有多个源路径,此时目标路径必须是一个目录。需要注意的是,当目标文件已存在时,仍然会拷贝并覆盖。

示例:

• hadoop fs -cp /user/hadoop/file1 /user/hadoop/file2

• hadoop fs -cp /user/hadoop/file1 /user/hadoop/file2 /user/hadoop/dir

返回值:

成功返回0,失败返回255(源路径不存在;失去与Namenode的连接或Namenode处于安全模式)。

1.1.17 cat

使用方法:hadoop fs -cat URI [URI …]

将路径指定文件的内容输出到stdout。

示例:

• hadoop fs -cat hdfs://host1:port1/file1 hdfs://host2:port2/file2

• hadoop fs -cat file:///file3 /user/hadoop/file4

返回值:

成功返回0,失败返回255(路径不是文件或不存在;失去与Namenode的连接)。

1.1.18 tail

使用方法:hadoop fs -tail [-f] URI

将文件尾部1K字节的内容输出到stdout。支持-f选项,行为和Unix中一致。

示例:

• hadoop fs -tail pathname

返回值:

成功返回0,失败返回255(路径不是文件或不存在;失去与Namenode的连接)。

1.1.19 setrep

使用方法:hadoop fs -setrep [-R] [-w] [-d] <rep> <path>

改变一个文件或目录的副本系数。

选项:

-R 递归改变目录下所有文件的副本系数。

-w 等待副本系数调整完毕后返回。

-d 只修改目录的副本系数,而不修改其第一级文件的副本系数。

示例:

• hadoop fs -setrep –R 3 /user/hadoop/dir1

返回值:

成功返回0,失败返回255(路径不存在;失去与Namenode的连接或Namenode处于安全模式)。

1.1.20 stat

使用方法:hadoop fs -stat [format] URI

返回指定路径的统计信息。

format选项:

%b 统计指定文件(或目录)占用的数据块数目。

%n 显示指定文件(或目录)的名称。

%o 显示指定文件(或目录)一个数据块的大小。

%r 显示指定文件(或目录)的副本系数。

%y, %Y 显示指定文件(或目录)的修改时间。

示例:

• hadoop fs -stat path

返回值:

成功返回0,失败返回255(路径不存在;失去与Namenode的连接)。

1.1.21 getmerge

使用方法:hadoop fs -getmerge <src> <localdst>

接受一个源目录和一个本地目标文件作为输入,并且将源目录中所有的文件连接成本地目标文件。

示例:

• hadoop fs -getmerge mergedir localfile

返回值:

成功返回0,失败返回255。

1.1.22 text

使用方法:hadoop fs -text <path>

将文件输出为文本格式。允许的格式是zip和TextRecordInputStream。

1.1.23 chmod

使用方法:hadoop fs -chmod [-R] MODE URI [URI …]

改变文件的权限。使用-R让改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者超级用户。

1.1.24 chown

使用方法:hadoop fs -chown [-R] [OWNER][:[GROUP]] URI [URI …]

改变文件的拥有者。使用-R让改变在目录结构下递归进行。命令的使用者必须是超级用户。

1.1.25 chgrp

使用方法:hadoop fs -chgrp [-R] GROUP URI [URI …]

改变文件所属的组。使用-R让改变在目录结构下递归进行。命令的使用者必须是文件的所有者或者超级用户。

1.1.26 moveToLocal

使用方法:dfs -moveToLocal [-crc] <src> <localdst>

输出一个”not implemented“信息。

更多命令信息,可以通过-help命令查看。

forward from: http://blog.csdn.net/myemail_sl/article/details/10427477
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: