您的位置:首页 > 运维架构

Hadoop伪分布模式安装学习笔记

2017-12-01 12:45 531 查看

伪分布模式安装步骤概述:

1. 修改ip

2. 修改hostname

3. 关闭防火墙

4. 设置ssh自动登录

5. 安装jdk

6. 安装hadoop

伪分布模式安装详细步骤:

【直接使用root用户登陆】,不要通过su root方式,因为通过这种方式有些操作不一定有权限。

1.设置静态ip
在centos桌面右上角的图标上,右键修改。
执行命令 service network restart 重启网卡
验证:执行命令 ifconfig

2.修改主机名
修改当前会话中的主机名,执行命令hostname hadoop
修改配置中文件中的主机名, vi /etc/sysconfig/network
验证:重启机器 reboot

3.把hostname和ip绑定
执行命令 vi /etc/hosts 增加一行内容,如下
192.168.80.100 hadoop
保存退出
验证:ping hadoop

4.关闭防火墙
执行命令: service iptables stop
验证:service iptables status

5.关闭防火墙自动运行
执行命令:chkconfig iptables off
验证:chkconfig --list | grep iptables

6.SSH(secure shell)的免密码登录
<1>执行命令 ssh-keygen -t rsa 产生秘钥,位于~/.ssh文件夹中
<2>执行命令 cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
验证:ssh localhost

7.安装JDK
<1>执行命令 rm -rf /usr/local/* 删除所有内容
<2>使用工具winscp把jdk文件从windows复制到/usr/local目录下
<3>执行命令 chmod u+x jdk-6u24-linux-i586.bin 赋予执行权限
<4>执行命令 ./jdk-6u24-linux-i586.bin 解压缩
<5>执行命令 mv jdk1.6.0_24 jdk 重命名
<6>执行命令 vi /etc/profile 设置环境变量
增加了2行内容
export JAVA_HOME=/usr/local/jdk
export PATH=.:$JAVA_HOME/bin:$PATH
保存退出
执行命令 source /etc/profile 让该设置立即生效
验证:执行 java -version

8.安装Hadoop
<1>执行命令 tar -zxvf hadoop-1.1.2.tar.gz 进行解压缩
<2>执行命令 mv hadoop-1.1.2 hadoop 重命名
<3>执行命令 vi /etc/profile 设置环境变量
增加了一行内容
export HADOOP_HOME=/usr/local/hadoop
修改了一行内容
export PATH=.:%HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH
保存退出
执行命令 source /etc/profile 让该设置立即生效
<4>修改hadoop的配置文件,位于$HADOOP_HOME/conf目录下
修改4个配置文件,分别是hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml
1.hadoop-env.sh的第9行
export JAVA_HOME=/usr/local/jdk/

2.core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop:9000</value>

4000
<description>change your own hostname</description>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
</configuration>

3.hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>

4.mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoop:9001</value>
<description>change your own hostname</description>
</property>
</configuration>
<5>执行命令 hadoop namenode -format 对Hadoop执行格式化 HDFS

<6>执行命令 start-all.sh 启动hadoop
验证:
(1)执行命令 jps查看是否有5个Java进程,分别NameNode,DataNode,SecondaryNode,JobTracker,TaskTracker.
(2)通过浏览器 http://hadoop:50070    可以看到界面,说明NameNode的进程是活的,NameNode本身是一个webserver http://hadoop:50030 可以看到界面,说明JobTracker的进程是活的,JobTracker本身是一个webserver
**可以修改windows下C:\Windows\System32\drivers\etc\hosts文件,在windows通过上述ip访问.**

<7>NameNode进程没有启动成功的原因?
(1)没有格式化
(2)配置文件只copy,不修改
(3)hostname与ip没有绑定

<8>多次格式化hadoop也是错误的?
方法:删除/usr/local/hadoop/tmp文件夹,重新格式化
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: