您的位置:首页 > 运维架构

Mapr 安装hadoop的组件(六)——安装Mahout

2013-12-30 23:25 218 查看
阿帕奇亨利马乌™是一个可扩展的机器学习库。有关亨利马乌更多信息,请参阅Apache的亨利马乌项目。
本页内容:

安装亨利马乌
配置环境亨利马乌
入门亨利马乌


安装亨利马乌

当MAPR服务是最初安装在讨论亨利马乌可以安装安装MAPR服务。如果初始MAPR服务安装过程中没有安装亨利马乌,亨利马乌可以在日后通过执行本节中的说明进行安装。这些程序可以在一个节点上的MAPR集群进行(见安装指南)或客户端(请参阅设置客户)。
下面的亨利马乌安装程序使用操作系统的软件包管理器,从MAPR存储库下载并安装亨利马乌。如果你想从包文件手动安装此组件,请参阅包和依赖关系为MAPR软件


在MAPR节点上安装亨利马乌

亨利马乌仅需要从其中亨利马乌应用程序将被执行的集群中的节点上安装。所以,你可能只需要一个节点上安装亨利马乌。但是,根据亨利马乌用户和预定亨利马乌作业数数,你可能需要一个以上的节点上安装亨利马乌。
亨利马乌应用程序可能运行MapReduce程序,默认情况下亨利马乌将使用群集的默认JobTracker的执行MapReduce作业。


运行Ubuntu一个MAPR节点上安装亨利马乌

运行Ubuntu作为MAPR节点上安装亨利马乌
或使用
sudo的
通过执行以下
的apt-get安装
命令:


运行Red Hat或CentOS的一个MAPR节点上安装亨利马乌

运行Red Hat或CentOS作为MAPR节点上安装亨利马乌
或使用
sudo的
执行以下
yum的安装
命令:


在客户端上安装亨利马乌

如果您在Linux客户机上安装亨利马乌,您可以从执行的MapReduce工作,你的客户端被配置为使用群集上运行的客户端应用程序亨利马乌。
提示:您不必为了从客户端运行亨利马乌应用程序在集群上安装亨利马乌。

运行Ubuntu客户端上安装亨利马乌

在客户机上运行的Ubuntu作为安装亨利马乌
或使用
sudo的
通过执行以下
的apt-get安装
命令:


在运行Red Hat或CentOS的客户端上安装亨利马乌

运行Red Hat或CentOS作为一个客户端上安装亨利马乌
或使用
sudo的
执行以下
yum的安装
命令:


配置环境亨利马乌

安装后,亨利马乌可执行文件位于以下目录:
/ opt/mapr/mahout/mahout- <VERSION> /斌/象夫



例如:
/ opt/mapr/mahout/mahout-0.7/bin/mahout


使用亨利马乌与MAPR,设置以下环境变量:

MAHOUT_HOME
-的路径亨利马乌目录。例如:
$出口MAHOUT_HOME = / opt/mapr/mahout/mahout-0.7




JAVA_HOME
-路径到Java目录。例如为Ubuntu:
$出口JAVA_HOME = / usr/lib/jvm/java-6-sun




JAVA_HOME
-路径到Java目录。例如红帽和CentOS:
$出口JAVA_HOME = / usr/java/jdk1.6.0_24




HADOOP_HOME
-路径到Hadoop的目录。例如:
$出口HADOOP_HOME = / opt/mapr/hadoop/hadoop-0.20.2




HADOOP_CONF_DIR
-从路径中,Hadoop配置参数的目录。例如:
$出口HADOOP_CONF_DIR = / opt/mapr/hadoop/hadoop-0.20.2/conf




您可以通过将它们添加到坚持设置这些环境变量对所有用户
的/ etc /环境
文件作为
或使用
sudo的
。文件中的环境变量的顺序并不重要。
例如条目在设置环境变量
在/ etc /环境
文件为Ubuntu:
JAVA_HOME=/usr/lib/jvm/java-6-sun


MAHOUT_HOME=/opt/mapr/mahout/mahout-0.7


HADOOP_HOME=/opt/mapr/hadoop/hadoop-0.20.2


HADOOP_CONF_DIR=/opt/mapr/hadoop/hadoop-0.20.2/conf

在设置环境变量的示例条目
在/ etc /环境
文件红帽和CentOS:
JAVA_HOME=/usr/java/jdk1.6.0_24


MAHOUT_HOME=/opt/mapr/mahout/mahout-0.7


HADOOP_HOME=/opt/mapr/hadoop/hadoop-0.20.2


HADOOP_CONF_DIR=/opt/mapr/hadoop/hadoop-0.20.2/conf

添加或编辑环境变量后
的/ etc /环境
文件中,你可以激活他们没有通过执行重新启动
的命令:

注:谁不有一个用户
的根
sudo的
权限,可以将这些环境变量项,以他或她的
〜/ bashrc中。
文件。环境变量会在每次用户登录时设置


入门亨利马乌

要查看捆绑亨利马乌示例应用程序,执行以下命令:

要运行二十新闻组分类示例,执行以下命令:

从这个例子中,输出将类似于以下内容:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: