您的位置：首页 > 其它

MapReduce开发程序，运行环境配置

2016-07-05 15:59 281 查看

Hadoop主机：linux

开发环境主机：Win7 + Itellij

本地运行

　　1. 下载hadoop安装包，放到本地目录中。

　　2. 配置环境变量$HADOOP_HOME及$PATH=$HADOOP_HOME/bin

　　3. 下载winutils.exe放到本地目录的$HADOOP_HOME/bin目录下。

　　4. 修改hadoop的源码

NativeIO.java org.apache.hadoop.io.nativeio
YARNRunner.java org.apache.hadoop.mapred

5. src目录下不能有hadoop的配置文件

　　6. 程序中的配置需要添加：

　　　　Configuration config = new Configuration();
　　　　config.set("fs.defaultFS", "hdfs://node1:8020");//不能使用集群地址，只能指定hdfs地址，本地执行mr任务，但是访问的hdfs还是hadoop主机的。

服务器运行

　　一、程序打包以后直接放到服务器端执行　　

　　　　将打包后的程序，放到服务器上，然后通过命令执行：hadoop jar *.jar

二、在本地调用，直接运行在服务器上

　　　　1、在src目录下放置hadoop配置文件

　　　　2、修改hadoop源码

　　　　　　NativeIO.java org.apache.hadoop.io.nativeio
　　　　　　YARNRunner.java org.apache.hadoop.mapred

　　　　3、程序中增加配置

　　　　　 configuration.set("mapred.jar","D:\\Project\\MyDemo\\etl\\out\\artifacts\\etl\\etl.jar");

程序编译成jar后生成的目录位置。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航