MapReduce开发程序,运行环境配置
2016-07-05 15:59
281 查看
Hadoop主机:linux
开发环境主机:Win7 + Itellij
2. 配置环境变量$HADOOP_HOME及$PATH=$HADOOP_HOME/bin
3. 下载winutils.exe放到本地目录的$HADOOP_HOME/bin目录下。
4. 修改hadoop的源码
NativeIO.java org.apache.hadoop.io.nativeio
YARNRunner.java org.apache.hadoop.mapred
5. src目录下不能有hadoop的配置文件
6. 程序中的配置需要添加:
Configuration config = new Configuration();
config.set("fs.defaultFS", "hdfs://node1:8020");//不能使用集群地址,只能指定hdfs地址,本地执行mr任务,但是访问的hdfs还是hadoop主机的。
将打包后的程序,放到服务器上,然后通过命令执行:hadoop jar *.jar
二、在本地调用,直接运行在服务器上
1、在src目录下放置hadoop配置文件
2、修改hadoop源码
NativeIO.java org.apache.hadoop.io.nativeio
YARNRunner.java org.apache.hadoop.mapred
3、程序中增加配置
configuration.set("mapred.jar","D:\\Project\\MyDemo\\etl\\out\\artifacts\\etl\\etl.jar");
程序编译成jar后生成的目录位置。
开发环境主机:Win7 + Itellij
本地运行
1. 下载hadoop安装包,放到本地目录中。2. 配置环境变量$HADOOP_HOME及$PATH=$HADOOP_HOME/bin
3. 下载winutils.exe放到本地目录的$HADOOP_HOME/bin目录下。
4. 修改hadoop的源码
NativeIO.java org.apache.hadoop.io.nativeio
YARNRunner.java org.apache.hadoop.mapred
5. src目录下不能有hadoop的配置文件
6. 程序中的配置需要添加:
Configuration config = new Configuration();
config.set("fs.defaultFS", "hdfs://node1:8020");//不能使用集群地址,只能指定hdfs地址,本地执行mr任务,但是访问的hdfs还是hadoop主机的。
服务器运行
一、程序打包以后直接放到服务器端执行将打包后的程序,放到服务器上,然后通过命令执行:hadoop jar *.jar
二、在本地调用,直接运行在服务器上
1、在src目录下放置hadoop配置文件
2、修改hadoop源码
NativeIO.java org.apache.hadoop.io.nativeio
YARNRunner.java org.apache.hadoop.mapred
3、程序中增加配置
configuration.set("mapred.jar","D:\\Project\\MyDemo\\etl\\out\\artifacts\\etl\\etl.jar");
程序编译成jar后生成的目录位置。
相关文章推荐
- fread()
- struts2添加需要的jar包
- 在VS Code上搭建Python开发环境
- VC PreTranslateMessage函数详解
- Android中ListView的优化
- weakreference 用法
- Golang中的并发
- 机器学习的学习路径
- 更新了MDK4.6之后的版本后TKStudio无法编译链接的解决办法
- Linux内存分布
- 解决C/C++程序执行一闪而过的方法(三种办法)
- wamp集成环境 开启rewrite伪静态支持
- 数据仓库,从数据仓库到大数据,数据平台这25年是怎样进化的
- golang 赋值操作符 := = ==
- MJExtension的用法
- Android Viewflipper详解。。
- HTML5 progress元素的样式控制、兼容与实例
- 局域网共享服务器可以ping通但访问不了
- Mac 下的MySQL ERROR 1227(42000): Access denied; you need (at least one of)
- Lua实现计算 UTF8 字符串的长度,每一个中文算一个字符