您的位置:首页 > 运维架构 > Linux

在centos6.5上离线安装Cloudera Manager 以及CDH

2017-01-24 13:55 525 查看
注:

Cloudera的大数据集群安装个人感觉在centos上比较稳定,debian上安装出现问题没有解决成功

以下是离线安装的具体步骤:(安装CDH5.9.0版本)

1.准备资源

下载安装程序cloudera-manager-installer.bin
http://archive-primary.cloudera.com/cm5/installer/5.9.0//cloudera-manager-installer.bin
下载CM 5.9.0
http://archive-primary.cloudera.com/cm5/repo-as-tarball/5.9.0/cm5.9.0-centos6.tar.gz
下载CDH 5.9.0:
http://archive-primary.cloudera.com/cdh5/repo-as-tarball/5.9.0//cdh5.9.0-centos6.tar.gz
下载Navigator Keytrustee 5
http://archive-primary.cloudera.com/navigator-keytrustee5/redhat/6/x86_64/navigator-keytrustee/
以上地址是个目录,需要将其中的内容(包括所有子目录的内容)都下载下来,然后打成tgz包navigator-keytrustee5.tgz

2.操作系统安装
在每个物理节点上安装CentOS6.5 64位操作系统。

若节点比较多的话,可以使用VMware vSphere Client 导出ova,然后导入创建centos6.5

需要注意的是:

磁盘分配的时候,为了便于管理,除了交换分区,将整个磁盘分成一个区,挂载在跟路径(/)下。

在安装过程中,安装类型选择最小安装minimal,这样可以减少软件冲突,并且更节省资源。

为所有节点分配IP地址,本文档采用以下IP地址

    192.168.1.150        Hadoop.Master

    192.168.1.151        Hadoop.Slave1

    192.168.1.152        Hadoop.Slave2

    192.168.1.153        Hadoop.Slave3

操作系统配置

配置IP地址

打开网卡配置文件

vi /etc/sysconfig/network-scripts/ifcfg-eth0

在打开的文件中配置IP地址、子网掩码、默认网关等信息,需要把ONBOOT修改为yes

ONBOOT=yes

BOOTPROTO=static

IPADDR=192.168.1.150          #网卡IP地址

NETMASK=255.255.255.0        #网卡网络地址

GATEWAY=192.168.1.1          #网卡网关地址

DNS1=114.114.114.114           #网卡DNS地址

BROADCAST=192.168.1.255      #广播地址

NETWORKING_IPV6=no            #禁用IPv6

IPV6_AUTOCONF=no        #禁用IPv6

修改保存后,重启网络服务

service network restart

关闭SELinux

打开配置文件

        vi /etc/selinux/config

将SELINUX配置项修改为disabled

        SELINUX=disabled

保存退出

关闭iptables防火墙

关闭防火墙

        service iptables stop

        service ip6tables stop

将防火墙修改为开机不启动

        chkconfig iptables off

        chkconfig ip6tables off

配置主机解析

打开配置文件

        vi /etc/hosts

修改为以下内容

127.0.0.1                localhost

192.168.1.150       Master.Hadoop

192.168.1.151       Slave1.Hadoop
192.168.1.152      Slave2.Hadoop

192.168.1.153       Slave2.Hadoop

192.168.1.150       archive.cloudera.com

禁用IPv6

把IPV6内核模块设置为  开机不加载

vi /etc/modprobe.d/blacklist.conf

添加一行

blacklist ipv6

在系统控制配置文件中禁用IPv6

        vi /etc/sysctl.conf

新增行

        net.ipv6.conf.all.disable_ipv6=1

在/etc/sysctl.conf文件中新增一行

vm.swappiness=0

新建sqoop2组(这个组在最新的Cloudera安装过程中不会自动创建,需手动创建)

groupadd sqoop2

修改主机名,以NameNode为例,打开/etc/sysconfig/network,修改HOSTNAME

HOSTNAME=Master.Hadoop

配置完成后重启操作系统(这些配置步骤在NameNode和DataNode上均需要进行)。

安装CM 5.3.2

注:以下依赖的第三方包最好用yum通过公网自动安装,手动安装将需要处理非常麻烦的依赖关系

如果你安装CENTOS的时候不是选择的Minimal安装,1-4步骤可以跳过

安装Apache Httpd服务,安装完成后启动httpd服务

yum install httpd

service httpd start

安装Perl

yum install perl

安装openssh-clients

yum install openssh-clients

下载其他需要的包(在NameNode和DataNode上都需要安装)

yum install bind-utils

yum install libxslt

yum install cyrus-sasl-gssapi

yum install redhat-lsb

yum install cyrus-sasl-plain

yum install portmap

yum install fuse

yum install fuse-libs

yum install nc

yum install python-setuptools

移除除系统自带的repo源        

mkdir /etc/yum.repos.d.bak

        cd /etc/yum.repos.d

        mv * ../yum.repos.d.bak

新建私有源

在上一步的目录下,创建文件myrepo.repo,内容如下

[cm]

name=cm

baseurl=http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5/

enabled=1

gpgcheck=0

[cdh]

name=cdh

baseurl=http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/

enabled=1

gpgcheck=0

[navigator-keytrustee]

name=navigator-keytrustee

baseurl=http://archive.cloudera.com/navigator-keytrustee5/redhat/6/x86_64/navigator-keytrustee/5/

enabled=1

gpgcheck=0

将下载好的cm5.3.2-centos6.tar.gz发布在httpd服务中

cd /var/www/html/

mkdir -p cm5/redhat/6/x86_64

cd cm5/redhat/6/x86_64/

tar -xzvf /root/cm5.9.0-centos6.tar.gz -C ./

chmod -R ugo+rX cm

安装Cloudera Manager

./cloudera-manager-installer.bin

确认安装成功

安装完成后,执行命令确认服务是否启动

        service cloudera-scm-server status

在浏览器里面输入(用户名admin,密码admin)
http://192.168.1.150:7180/cmf/login
    登陆后选择免费使用

安装CDH 5.3.2

将下载好的cdh5.3.2-centos6.tar.gz发布到httpd服务中

cd /var/www/html

mkdir -p cdh5/redhat/6/x86_64

cd cdh5/redhat/6/x86_64

tar xzvf /root/cdh5.9.0-centos6.tar.gz -C ./

chmod -R ugo+rX cdh

执行命令

cd /var/www/html

mkdir -p navigator-keytrustee5/redhat/6/x86_64

cd navigator-keytrustee5/redhat/6/x86_64

tar xzvf /root/navigator-keytrustee5.tar.gz -C ./

chmod -R ugo+rX navigator-keytrustee

在浏览器打开http://192.168.0.150:7180用admin/admin登录,本文档的安装过程只将CDH装在NameNode(即NameNode和DataNode为一台物理机)上,在实际生产环境中需要将其安装在所有DataNode上。

至此,Cloudera大数据环境安装完毕

问题:

1、安装过程中安装包下载慢,尝试直接在命令行下执行yum命令,直接安装相应的rpm包

2.启动不成功,修改客户端 /etc/cloudera-scm-agent/config.ini配置文件中service_host 为cloudera_server地址或者主机名并开启server端口7182

如:server_host=10.12.116.102

3.想要删除管理主机,需要删除 psql或mysql中的注册的host对应的ip

使用psql工具连接数据库进行删除

4、正在检查 NameNode 的名称目录是否为空。仅在为空时格式化 HDFS。

删除rm –rf /dfs/*

•无法发出查询:Service Monitor 未运行

 增加角色用例---

5.卸载集群

//CDH5.X完全卸载步骤

# by coco

# 2015-01-14

1). 关闭集群中的所有服务。

 这个可以通过clouder manger 主页关闭集群。

2). 卸载

[root@master ~]# /usr/share/cmf/uninstall-cloudera-manager.sh

[root@slave1 ~]# service cloudera-scm-agent stop

[root@slave1 ~]# service cloudera-scm-agent stop

一下都是所有要卸载的集群均要执行清除工作:

[root@master ~]# umount /var/run/cloudera-scm-agent/process

[root@slave1 ~]# umount /var/run/cloudera-scm-agent/process

[root@slave2 ~]# umount /var/run/cloudera-scm-agent/process

[root@master ~]# rm -rf /usr/share/cmf /var/lib/cloudera* /var/cache/yum/x86_64/6/cloudera* /var/log/cloudera* /var/run/cloudera*  /etc/cloudera*

3). 卸载安装包:

[root@slave1 ~]# rpm -qa | grep cloudera

[root@slave2 ~]# for f in `rpm -qa | grep cloudera `  ; do rpm -e ${f} ; done     (如果有保存,在执行一遍)

4). 清除安装文件

 rm -rf /var/lib/hadoop-* /var/lib/impala /var/lib/solr /var/lib/zookeeper /var/lib/hue /var/lib/oozie  /var/lib/pgsql  /var/lib/sqoop2  /data/dfs/  /data/impala/ /data/yarn/  /dfs/ /impala/ /yarn/  /var/run/hadoop-*/ /var/run/hdfs-*/ /usr/bin/hadoop* /usr/bin/zookeeper*
/usr/bin/hbase* /usr/bin/hive* /usr/bin/hdfs /usr/bin/mapred /usr/bin/yarn /usr/bin/sqoop* /usr/bin/oozie /etc/hadoop* /etc/zookeeper* /etc/hive* /etc/hue /etc/impala /etc/sqoop* /etc/oozie /etc/hbase* /etc/hcatalog

//只删除hadoop系列的,不要删除其他软件的,否则其他软件的版本控制会被破坏

[root@master alternatives]# rm -rf ` find /var/lib/alternatives/* ! -name "mta" ! -name "print" ! -name "zlibrary-ui"  -mtime -3`

[root@master alternatives]# rm -rf /etc/alternatives/*

5). 杀死相关进程:

for u in hdfs mapred cloudera-scm hbase hue zookeeper oozie hive impala flume; do sudo kill $(ps -u $u -o pid=); done

6). 删除parcel包分发文件和解压文件

  rm -rf /opt/cloudera/parcel-cache /opt/cloudera/parcels

到此卸载完毕。

5.org.apache.Hadoop.Hbase.TableExistsException: hbase:namespace这个错误只会出现在安装独立zookeeper的方案中,

当以前安装了一个版本,后来又换了一个新版本的时候会包这个错误,是因为上次安装的hbase信息在zookeeper目录下已经存在造成的,具体错误如下

解决方案:

登录到zookeeper节点的机器上

cd /ZOOKEEPER_HOME/bin下(/usr/lib/zookeeper/bin)

执行sh zkCli.sh

如上,执行ls /可以查看到zookeeper上已有hbase目录

执行rmr /hbase删除即可

重新启动hbase

6.ntp时间同步

yum install ntp

1). # rpm -ivh ntp-4.1.2-4.EL3.1.i386.rpm

2). # vi /etc/ntp.conf

注释一行

restrict default ignore

加入一行

restrict 192.168.10.0 mask 255.255.255.0 notrust nomodify notrap

3). # vi /etc/ntp/step-tickers

加入一行

pool.ntp.org

这样每次ntpd启动时,会自动连接该国际标准时间服务器;

4). # service ntpd start

5). # netstat -an |grep 123

确保该端口以udp方式开放

时间客户端配置(192.168.10.2)

1). # ntpdate 192.168.10.2

应该显示同步成功

2). # crond -e

加入

0-59/10 * * * * /usr/sbin/ntpdate 192.168.10.1

表示每隔10分钟同步一次时间

6 Unknow Health:

Unknow Health

重启后:Request to theHost Monitor failed.

service --status-all| grep clo

机器上查看scm-agent状态:cloudera-scm-agent dead but pid file exists

解决:重启服务

service cloudera-scm-agent restart

 service cloudera-scm-server restart
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: