Hadoop 配置(3)---使用 HDFS
2016-06-25 07:39
381 查看
伪分布式读取的则是 HDFS 上的数据。要使用 HDFS,首先需要在 HDFS 中创建用户目录:
[/code]
接着将 ./etc/hadoop 中的 xml 文件作为输入文件复制到分布式文件系统中,即将 /usr/local/hadoop/etc/hadoop 复制到分布式文件系统中的 /user/hadoop/input 中。
[/code]
查看:
[/code]
测试:
[/code]
[/code]
来自为知笔记(Wiz)
./bin/hdfs dfs -mkdir -p /user/hadoop
[/code]
接着将 ./etc/hadoop 中的 xml 文件作为输入文件复制到分布式文件系统中,即将 /usr/local/hadoop/etc/hadoop 复制到分布式文件系统中的 /user/hadoop/input 中。
./bin/hdfs dfs -mkdir input
./bin/hdfs dfs -put ./etc/hadoop/*.xml input
[/code]
查看:
./bin/hdfs dfs -ls input
[/code]
测试:
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount input/core-site.xml output/RESULT
[/code]
./bin/hdfs dfs -cat output/RESULT/*
[/code]
来自为知笔记(Wiz)
相关文章推荐
- Hadoop 配置(1)
- Hadoop 配置(2)-Hadoop伪分布式配置
- 基于Hadoop生态圈的数据仓库实践 —— 目录
- ubuntu 12.04安装OpenGL
- erdaicms旅游网站程序模板免费下载(PC站自带手机站,自带3套模板可切换,对接支付宝和微信支付)
- centos 7 源码安装及 php-fpm 配置与 nginx 集成
- Linux 添加so搜索目录
- Linux命令行下常用快捷键
- 如何在tomcat安装部署php项目
- linux内核sysfs详解
- hadoop安装后测试运行
- linux上java环境搭建
- 经典三层架构
- Linux Golang 环境搭建(版本1.6.2)
- 常用游戏资源网站
- OpenTSDB 教材收藏
- shell中的数学运算
- linux内核时常碰到的汇编指令(详尽版部分)
- 不仅仅是外贸网站才需要独立IP-独立IP的优点
- twoo是什么网站