您的位置：首页 > 大数据

大数据 hadoop2.5.2伪分布式搭建

2017-06-20 14:24 141 查看

1.准备Linux环境

   1.0点击VMware快捷方式，右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段：192.168.8.0 子网掩码：255.255.255.0 -> apply -> ok

       回到windows --> 打开网络和共享中心 -> 更改适配器设置 -> 右键VMnet1 -> 属性 -> 双击IPv4 -> 设置windows的IP：192.168.8.100 子网掩码：255.255.255.0 -> 点击确定

       在虚拟软件上 --My Computer -> 选中虚拟机 -> 右键 -> settings -> network adapter -> host only -> ok

   有的同学不可以联网，为了让window和linux通信我们可以使用host only



1.1修改主机名

       vim /etc/sysconfig/network



       NETWORKING=yes

       HOSTNAME=itcast01    ###

   1.2修改IP

       两种方式：

       第一种：通过Linux图形界面进行修改（强烈推荐）

           进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections -> 选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 -> method选择为manual -> 点击add按钮 -> 添加IP：192.168.8.118 子网掩码：255.255.255.0 网关：192.168.1.1 -> apply





       第二种：修改配置文件方式（屌丝程序猿专用）

           vim /etc/sysconfig/network-scripts/ifcfg-eth0



           DEVICE="eth0"

           BOOTPROTO="static"               ###

           HWADDR="00:0C:29:3C:BF:E7"

           IPV6INIT="yes"

           NM_CONTROLLED="yes"

           ONBOOT="yes"

           TYPE="Ethernet"

           UUID="ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c"

           IPADDR="192.168.8.118"           ###

           NETMASK="255.255.255.0"          ###

           GATEWAY="192.168.8.1"            ###

                        DNS1="8.8.8.8" //谷哥提供

                        DNS1="8.8.4.4"   在地球上就可以用



   1.3修改主机名和IP的映射关系

       vim /etc/hosts



       192.168.8.118   itcast01



   1.4关闭防火墙

       #查看防火墙状态

       service iptables status

       #关闭防火墙

       service iptables stop

       #查看防火墙开机启动状态

       chkconfig iptables --list

       #关闭防火墙开机启动

       chkconfig iptables off



   1.5重启Linux

       reboot

2.安装JDK

   2.1上传



   2.2解压jdk 最好不要用jdk8

       #创建文件夹

       mkdir /usr/java

       #解压

       tar -zxvf jdk-7u55-linux-i586.tar.gz -C /usr/java/

                z-格式 x释放 c创建 v显示 f 文件 -C解压到



   2.3将java添加到环境变量中

       vim /etc/profile

       #在文件最后添加

       export JAVA_HOME=/usr/java/jdk1.7.0_55

       export PATH=$PATH:$JAVA_HOME/bin



       #刷新配置

       source /etc/profile



3.安装hadoop2.5.2 可以去 archive.apache.org/dist/ 下载所有开源都在这里

        hadoop文件结构:include --存储头文件 libexec lib 本地的一些库 share是依赖java jar

   注意：hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop

   伪分布式需要修改5个配置文件

   3.1配置hadoop

   第一个：hadoop-env.sh

       vim hadoop-env.sh

       #第27行

       export JAVA_HOME=/usr/java/jdk1.7.0_65 ##要修改，不然会报一个错



   第二个：core-site.xml

       

       <property>

           <name>fs.defaultFS</name>

           <value>hdfs://yuhui1:9000</value>

       </property>

       

       <property>

           <name>hadoop.tmp.dir</name>

           <value>/root/hadoop-2.4.1/tmp</value>

        </property>



   第三个：hdfs-site.xml

       

       <property>

           <name>dfs.replication</name>

           <value>1</value>

                </property>

                <property>

        <name>dfs.permissions</name>

        <value>false</value>

</property>



   第四个：mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)

       mv mapred-site.xml.template mapred-site.xml

       vim mapred-site.xml

       

       <property>

           <name>mapreduce.framework.name</name>

           <value>yarn</value>

        </property>

       y-复制 p粘贴

   第五个：yarn-site.xml

       

       <property>

           <name>yarn.resourcemanager.hostname</name>

           <value>yuhui1</value>

        </property>

       

        <property>

           <name>yarn.nodemanager.aux-services</name>

           <value>mapreduce_shuffle</value>

        </property>



   3.2将hadoop添加到环境变量



   vim /etc/proflie

       export JAVA_HOME=/usr/java/jdk1.7.0_65

       export HADOOP_HOME=/itcast/hadoop-2.4.1

       export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

               export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native

　　　　       export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"



source /etc/profile



   3.3格式化namenode（是对namenode进行初始化,文件系统格式化，相当于对硬盘进行格式化）

       hdfs namenode -format (hadoop namenode -format)



   3.4启动hadoop

       先启动HDFS

       sbin/start-dfs.sh



       再启动YARN

       sbin/start-yarn.sh



   3.5验证是否启动成功

       使用jps命令验证

       27408 NameNode

       28218 Jps

       27643 SecondaryNameNode

       28066 NodeManager

       27803 ResourceManager

       27512 DataNode



       http://192.168.0.1:50070 （HDFS管理界面）

       http://192.168.0.1:8088 （MR管理界面）

                测试hdfs验证:上传一些文件 hadoop fs -put /root/aa.txt /

                                          hadoop fs -get /aa.txt /root/ 把hdfs上的文件下载到/root/下

                测试yarn hadoop jar hadoop-mapreduce-examples-2.5.2.jar wordcount /aa.txt /bb

                hadoop jar hadoop-mapreduce-examples-2.5.2.jar 回车能看到有哪些案例

                遇到问题 : hadoop下会有logs文件，日志里会记录错误信息 .

                out表示运行时的一些参数信息 .log表示错误日志



                NameNode接收用户请求，管理元数据，

                YARN老大 ResourceManager负责资源分布，资源调度,NodeManager是小弟，可以有多个小弟

                SecondaryNameNode是NameNode一个助理帮助namenode完成数据同步。

4.配置ssh免登陆 secure shell

          ssh yuhui1 mkdir /aaa //向yuhui1发送一个创建文件指令



    hadoop为什么要走ssh协议？因为以后集群中会有很多机器，一机子向其它机发送启动指令，需要配置免登录

    .ssh表示linux隐藏文件里面有known_hosts知道的主机，目前只知道自己

   #生成ssh免登陆密钥

   #进入到我的home目录

   cd ~/.ssh

   ssh-keygen -t rsa （四个回车） rsa表示加密算法,这个算法，就是机算机破解也需要很多年

   执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）非对称加密

        more id_rsa

   将公钥拷贝到要免登陆的机器上

   ssh-copy-id localhost

         配置两台电脑免登录。

        ssh yuhui4 exit还能退出到上一级

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航