Linux集群Hadoop2.5.1完全分布式安装
2015-04-14 21:47
633 查看
一、实践环境
Ubuntu14.04 + JDK1.8.0_25 + Hadoop2.5.1
一共三台linux机器(virtualbox虚拟机,桥接网络配置静态ip),信息如下:
二、安装配置linux系统
1. 在三台机器上安装好ubuntu系统。
2. 更新一下系统软件, sudoapt-get update。
3. 修改机器名, sudo gedit/etc/hostname:
每台机器都要修改,对于slave机器,修改名称为slave1, slave2….
4. 修改hosts文件,sudo gedit/etc/hosts:
每台机器上的hosts文件内容都相同。
5. 在每台机器上新建一个名为jsj的用户:
sudo adduser jsj
更改jsj文件夹的权限:
sudo chown –R jsj:jsj jsj
三、安装配置SSH
1. 安装ssh服务:sudoapt-get install ssh
2. 在每台机器的/home/jsj目录下都用jsj用户新建一个.ssh/目录
3. 在每台机器上都生成ssh密钥: ssh –keygen –t rsa
4. 在master主机上,把id_rsa.pub添加到authorized_keys文件中:
jsj@master:/home/jsj/.ssh/$catid_rsa.pub >> authorized_keys
5. 在master主机上,将slave1,slave2的id_rsa.pub添加到authorized_keys文件中:
ssh slave1 cat /home/jsj/.ssh/id_rsa.pub >> authorized_keys
ssh slave2 cat /home/jsj/.ssh/id_rsa.pub >> authorized_keys
6. 在master上通过scp命令将authorized_keys复制到slave1,slave2机器上:
scp authorized_keys jsj@slave1:/home/jsj/.ssh/
scp authorized_keys jsj@slave2:/home/jsj/.ssh/
7. 验证是否成功,可以通过sshlocalhost, ssh slave1, ssh slave2 验证是否配置成功。
四、安装JDK
1. 下载jdk-8u25-linux-x64.gz
2. 在/usr/lib目录下新建文件夹jvm/,将jdk压缩包解压到此目录下。
3. 配置环境变量,修改/etc/profile文件:
4. 使设置生效:$source /etc/profile
五、Hadoop 2.5.1安装配置
1. 下载hadoop-2.5.1.tar.gz,在master机器上修改好配置文件,然后scp同步到其他slave上即可。
2. 将hadoop-2.5.1.tar.gz解压到/home/jsj/目录下。
3. 配置环境变量 sudo gedit/etc/profile
4. 修改/home/jsj/Hadoop-2.5.1/etc/hadoop目录下的配置文件
修改hadoop-env.sh文件,修改JAVA_HOME的值如下:
5. 修改yarn-env.sh文件,修改JAVA_HOME的值如下:
6. 修改文件slaves,这个文件里面保存所有的slave节点:
7. 修改core-site.xml文件:
8. 修改hdfs-site.xml文件:
9. 修改mapred-site.xml文件:
10. 修改yarn-site.xml文件:
11. 复制到其他节点
将master节点上配好的hadoop复制到其他节点,使用命令:
scp –r /home/jsj/hadoop-2.5.1 jsj@slave1:/home/jsj/hadoop-2.5.1
scp –r /home/jsj/hadoop-2.5.1 jsj@slave2:/home/jsj/hadoop-2.5.1
12. 运行hadoop
①在master机器上的/home/jsj/hadoop-2.5.1 目录下执行命令格式化namenode:
bin/hdfs namenode -format
②然后执行 sbin/start-dfs.sh 启动hdfs,执行 sbin/start-yarn.sh 启动yarn.
③最后用命令jps查看hadoop的运行状态。
Ubuntu14.04 + JDK1.8.0_25 + Hadoop2.5.1
一共三台linux机器(virtualbox虚拟机,桥接网络配置静态ip),信息如下:
机器名 | IP | 作用 |
master | <ip> | Namenode, master |
slave1 | <ip> | Datanode, slave |
slave2 | <ip> | Datanode, slave |
1. 在三台机器上安装好ubuntu系统。
2. 更新一下系统软件, sudoapt-get update。
3. 修改机器名, sudo gedit/etc/hostname:
每台机器都要修改,对于slave机器,修改名称为slave1, slave2….
4. 修改hosts文件,sudo gedit/etc/hosts:
每台机器上的hosts文件内容都相同。
5. 在每台机器上新建一个名为jsj的用户:
sudo adduser jsj
更改jsj文件夹的权限:
sudo chown –R jsj:jsj jsj
三、安装配置SSH
1. 安装ssh服务:sudoapt-get install ssh
2. 在每台机器的/home/jsj目录下都用jsj用户新建一个.ssh/目录
3. 在每台机器上都生成ssh密钥: ssh –keygen –t rsa
4. 在master主机上,把id_rsa.pub添加到authorized_keys文件中:
jsj@master:/home/jsj/.ssh/$catid_rsa.pub >> authorized_keys
5. 在master主机上,将slave1,slave2的id_rsa.pub添加到authorized_keys文件中:
ssh slave1 cat /home/jsj/.ssh/id_rsa.pub >> authorized_keys
ssh slave2 cat /home/jsj/.ssh/id_rsa.pub >> authorized_keys
6. 在master上通过scp命令将authorized_keys复制到slave1,slave2机器上:
scp authorized_keys jsj@slave1:/home/jsj/.ssh/
scp authorized_keys jsj@slave2:/home/jsj/.ssh/
7. 验证是否成功,可以通过sshlocalhost, ssh slave1, ssh slave2 验证是否配置成功。
四、安装JDK
1. 下载jdk-8u25-linux-x64.gz
2. 在/usr/lib目录下新建文件夹jvm/,将jdk压缩包解压到此目录下。
3. 配置环境变量,修改/etc/profile文件:
4. 使设置生效:$source /etc/profile
五、Hadoop 2.5.1安装配置
1. 下载hadoop-2.5.1.tar.gz,在master机器上修改好配置文件,然后scp同步到其他slave上即可。
2. 将hadoop-2.5.1.tar.gz解压到/home/jsj/目录下。
3. 配置环境变量 sudo gedit/etc/profile
4. 修改/home/jsj/Hadoop-2.5.1/etc/hadoop目录下的配置文件
修改hadoop-env.sh文件,修改JAVA_HOME的值如下:
5. 修改yarn-env.sh文件,修改JAVA_HOME的值如下:
6. 修改文件slaves,这个文件里面保存所有的slave节点:
7. 修改core-site.xml文件:
8. 修改hdfs-site.xml文件:
9. 修改mapred-site.xml文件:
10. 修改yarn-site.xml文件:
11. 复制到其他节点
将master节点上配好的hadoop复制到其他节点,使用命令:
scp –r /home/jsj/hadoop-2.5.1 jsj@slave1:/home/jsj/hadoop-2.5.1
scp –r /home/jsj/hadoop-2.5.1 jsj@slave2:/home/jsj/hadoop-2.5.1
12. 运行hadoop
①在master机器上的/home/jsj/hadoop-2.5.1 目录下执行命令格式化namenode:
bin/hdfs namenode -format
②然后执行 sbin/start-dfs.sh 启动hdfs,执行 sbin/start-yarn.sh 启动yarn.
③最后用命令jps查看hadoop的运行状态。
相关文章推荐
- 完全分布式hadoop集群安装之二:linux虚拟机安装及管理(centos 6.0 32位)
- linux hadoop完全分布式集群搭建图文详解
- Hbase完全分布式集群安装配置(Hbase1.0.0,Hadoop2.6.0)
- hadoop学习之hadoop2.8.0完全分布式集群安装
- 在centos6.6上安装hadoop完全分布式集群并运行第一个程序
- hadoop完全分布式集群搭建(Ubuntu14.04+Hadoop2.5.1)(自测成功)
- Hadoop2.5.1完全分布式安装
- Hadoop集群完全分布式安装
- 基于hadoop集群的Hive1.2.1、Hbase1.2.2、Zookeeper3.4.8完全分布式安装
- hadoop学习之hadoop完全分布式集群安装
- hadoop学习之hadoop完全分布式集群安装
- Hadoop-2.6.0完全分布式集群+Zookeeper安装测试(二)
- Hadoop2.7.3完全分布式集群安装过程
- hadoop完全分布式手动安装(一主多从centos linux各版本均试验成功,文档完整无一遗漏)
- Hadoop2.6.2完全分布式集群HA模式安装配置详解
- Hadoop完全分布式集群安装Hbase
- Hadoop 2.6 集群搭建从零开始之4 Hadoop的安装与配置(完全分布式环境)
- Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程~
- hadoop学习之hadoop完全分布式集群安装
- Hadoop2.6.2完全分布式集群HA模式安装配置详解