Hadooop运行WordCount(Hello world)程序
2017-05-27 16:50
197 查看
一、 Hadoop2.7.3安装并配置成功
二、
在HDFS中创建input文件目录
hadoop fs -mkdir /input
三、当前在hadoop-2.7.3的目录下,有个LICENSE.txt的文件,把它放到hdfs的input目录下面
hadoop fs -put LICENSE.txt /input
四、
(1)查看文件是否正确传入到/input目录下
hadoop fs -ls /input
(2)查看文件内容
hadoop fs -cat /input/LICENSE.txt
五、执行 hadoop jar /usr/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output
按我前面的配置会卡在mapreduce.Job: Running job
在etc/hadoop/mapred-site.xml中,如果配置
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
则使用yarn来进行计算,那么必须启动nodemanager,
如果不使用yarn,进行mapreduce.job.tracker配置,也可以用MRv2来执行job,这样就不需要启动nodemanager:
<property>
<name>mapreduce.job.tracker</name>
<value>hdfs://192.168.153.129:8001</value>
<final>true</final>
</property>
六、修改后重新运行 hadoop jar /usr/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output3
七、查看输出结果的目录下的文件
hadoop fs -ls /output3
查看输出结果
hadoop fs -cat /output3/part-r-00000
二、
在HDFS中创建input文件目录
hadoop fs -mkdir /input
三、当前在hadoop-2.7.3的目录下,有个LICENSE.txt的文件,把它放到hdfs的input目录下面
hadoop fs -put LICENSE.txt /input
四、
(1)查看文件是否正确传入到/input目录下
hadoop fs -ls /input
(2)查看文件内容
hadoop fs -cat /input/LICENSE.txt
五、执行 hadoop jar /usr/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output
按我前面的配置会卡在mapreduce.Job: Running job
在etc/hadoop/mapred-site.xml中,如果配置
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
则使用yarn来进行计算,那么必须启动nodemanager,
如果不使用yarn,进行mapreduce.job.tracker配置,也可以用MRv2来执行job,这样就不需要启动nodemanager:
<property>
<name>mapreduce.job.tracker</name>
<value>hdfs://192.168.153.129:8001</value>
<final>true</final>
</property>
六、修改后重新运行 hadoop jar /usr/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output3
七、查看输出结果的目录下的文件
hadoop fs -ls /output3
查看输出结果
hadoop fs -cat /output3/part-r-00000
相关文章推荐
- hadooop的wordcount程序
- Spark在Yarn上运行Wordcount程序
- Spark在Yarn上运行Wordcount程序
- ubuntu里第二次运行wordcount程序出错
- hadoop 集群运行WordCount示例程序
- Eclipse环境搭建并且运行wordcount程序
- Linux下编写运行自己的WordCount程序
- 用hadoop运行一个简单程序WordCount
- 第六篇:Eclipse上运行第一个Hadoop实例 - WordCount(单词统计程序)
- Hadoop实例WordCount程序一步一步运行
- 将java开发的wordcount程序部署到spark集群上运行
- 在windows上用eclipse远程运行hadoop上的wordcount程序出现的问题,求解决
- eclipse运行WordCount程序记录
- Hadoop 1.x 使用eclipse集成环境运行WordCount程序
- WordCount程序运行流程分析
- hadoop2.2.0配置eclipse运行wordcount程序问题及解决方法
- Hadoop示例程序WordCount运行及详解
- AWS EMR运行MAPREDUCE程序-WORDCOUNT