您的位置:首页 > 运维架构

hadoop2.x整合手册【4】---mahout0.9安装部署与测试

2014-06-05 11:11 423 查看
基本过程和0.8版本的安装/article/1477589.html的一致

需要在bin目录下的mahout文件的头部添加如下环境变量

HADOOP_CONF_DIR="hadoop的配置目录需要以/结尾"
HADOOP_HOME="hadoop的安装目录需要以/结尾"
MAHOUT_HEAPSIZE=2000 mahout可以调用的内存量,建议设的比较大


另外修改hadoop配置目录下的mapred-site.xml的文件,添加如下参数

<name>mapred.child.java.opts</name>
		<value>-Xmx1024m</value>
	</property>
如果是算法计算密集型的,建议超过1024的进行设置,而hadoop默认的200m的设置是不够用mahout使用的

另外修改hadoop配置目录下的hadoop-env.sh的文件,将export HADOOP_HEAPSIZE的注释取消

export HADOOP_HEAPSIZE=2000


设置hadoop的可用内存为2000M

如果仍然在运行mahout中出现java heap space的错误,可以将以上的两项设置的参数依据实际硬件条件设置更大

mahout的验证方法与0.8版本方法相同
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: