您的位置：首页 > 运维架构

Hadoop伪分布式集群搭建

2017-12-16 12:17 239 查看

声明：作者原创，转载注明出处。

作者：帅气陈吃苹果

1、下载Hadoop压缩包

wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.6.5/hadoop-2.6.5.tar.gz[/code] 
2、解压Hadoop压缩包
mkdir /bigdata
tar -zxvf hadoop-2.6.5.tar.gz -C /bigdata


3、配置Hadoop（伪分布式）
cd /bigdata/hadoop-2.6.5/etc/hadoop


1）vim hadoop-env.xml

export JAVA_HOME=/usr/lib/jvm/java


2）vim core-site.xml

<configuration>
<!-- 配置hdfs的namenode的地址-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://master</value>
<property>
<!-- 配置Hadoop运行时产生数据的存储目录，注意：不是临时数据 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/local/var/hadoop/tmp/hadoop~${user.name}</value>
</property>
</configuration>


3）vim hdfs-site.xml

<configuration>
<!-- 指定HDFS存储数据的副本数据量-->
<property>
<name>dfs.replication</name>
<value>1</value>
<property>
</configuration>


4）vim mapred-site.xml

<configuration>
<!-- 指定MapReduce编程模型运行在YARN上-->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
<property>
</configuration>


5）vim yarn-site.xml

<configuration>
<!-- 指定YARN的resourcemanager的地址（伪分布式时就是主机名，localhost或IP地址都行） -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
<property>

<!--  MapReduce执行shuffle时获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
<property>
</configuration>


6）vim /etc/hosts

添加主机ip与主机名的映射：

192.168.29.188 master


4、HDFS初始化
即格式化HDFS（的namenode），

cd hadoop/hadoop-2.6.5/bin

hadoop namenode -format


5、启动Hadoop集群
cd hadoop/hadoop-2.6.5/sbin

//在hadoop-2.x中，推荐使用start-dfs.sh和start-yarn.sh来分别启动
start-all.sh


6、使用jps命令查看进程是否存在
8707    DataNode
8580    NameNode
9013    ResourceManager
8873    SecondaryNameNode
18057   Application
9308    NodeManager
17644   Jps


7、查看WEB界面
访问HDFS的管理界面：ip:50070

访问YARN的管理界面：ip:8088

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航