hadoop学习笔记-2-安装
2012-10-31 16:57
337 查看
环境
Windows XP + VMWare WorkStation7.1 +centos6虚拟机 + JDK1.7 + Hadoop0.20.2centos安装JDK1.7(如果使用centos自带的jdk,忽略这一步)
1. 在oracle官方网站下载最新的jdk1.7的i586的rpm包2. 双击rpm包运行,需要root授权,即可安装成功,也可使用命令行:rpm –ivh ***
3. 卸载centos自带的openjdk,我使用的centos6.3自带了1.5和1.6两个版本,使用命令:
rpm -qa|grep gcj
查看版本号,然后使用root权限用户删除其中的jdk为1.5的,具体与centos自带的版本有关:
yum -y remove java java-1.X.Y-gcj-compat-1.X.Y.0-40jpp.115
使用命令:
rpm –qa | grep jdk
再使用上面的命令删除jdk1.6自带的
yum -y remove java java-1.X.Y-gcj-compat-1.X.Y.0-40jpp.115
4. 编辑/etc/profile文件,末尾添加环境变量(中间是冒号,classpath中开头为逗点和冒号):
export J***A_HOME=/usr/java/jdk1.6.0_21
export PATH=$J***A_HOME/bin:$PATH
export CLASSPATH=.:$J***A_HOME/lib/dt.jar:$J***A_HOME/lib/tools.jar
5. 重启操作系统:reboot
6. 执行java –version,可以看到已经是最新的jdk1.7了
安装Hadoop0.20.2
1. 按照教材要求,安装Hadoop0.20.2,官网下载Hadoop0.20.22. 解压到指定目录:tar –zxvf hadoop-x.y.z.tar.gz -C /usr
3. 编辑/etc/profile文件,末尾继续添加,设置环境变量:
export HADOOP_INSTALL=/usr/hadoop-0.20.2
export PATH=$PATH:$HADOOP_INSTALL/bin
4. 重启操作系统:reboot,执行hadoop version,正常显示即安装成功
提示
1) 安装hadoop0.20.2需要指定环境变量:J***A_HOME,所以如果使用centos自带的openjdk,需要指定添加J***A_HOME环境变量,如:export J***A_HOME=/usr/lib/jvm/jvm-6**
2) 查看设定的环境变量的值,可使用echo命令,如:[user@localhost ~]# echo $J***A_HOME
安装伪分布Hadoop模式
1. 进入hadoop根目录(例如:cd/usr/hadoop-x.y.z),进入config目录,编辑其中的配置文件:core-site.xml(配置hdfs所在的机器,即namenode),hdfs-site.xml(配置复制策略),mapred-site.xml(配置job所在的机器,即jobtracker),2. 伪分布不是真正的分布式,所以这些都为本机地址:
<!—core-site.xml-->
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost</value>
</property>
<configuration>
<!—hdfs-site.xml-->
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<configuration>
<!—mapred-site.xml-->
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:8021</value>
</property>
<configuration>
3. 按照下面centos设置ssh免密码登录设置ssh
4. 格式化namenode,执行hadoop namenode -format
5. 启动进程:
start-dfs.sh
start-mapred.sh
6. 验证是否正常启动。访问jobtracker:http://localhost:50030,访问namenode:http://localhost:50070,如果都能访问,说明正常启动了。
7. 关闭进程:
stop-dfs.sh
stop-mapred.sh
提示:
1. 如果不能正常运行,提示J***A_HOME没有找到路径,则需要编辑在conf/hadoop-env.sh中指明J***A_HOME的路径。
2. 如果还是不能运行,或者能访问50030不能访问50070,则说明namenode没有正常启动,重新格式化一次,重新启动试试:hadoop namenode -format
centos设置ssh免密码登录
1. 切换root用户,创建密码为空的RSA密钥,执行:ssh-keygen -trsa –P ‘’ –f ~/.ssh/id_rsa
2. 将公钥添加到authorized_keys中
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
3. 编辑sshd配置文件,在etc/ssh/sshd_config中,将其中的
#AuthorizedKeysFile .ssh/authorized_keys 前面的注释取消掉
4. 设置开机启动sshd服务,运行:chkconfig sshd on
5. 重启sshd服务:service sshd restart
6. 登录本机ssh试试:ssh localhost
提示:
1. Linux机器需要安装ssh,centos默认安装自带了ssh
2. 第三步是centos特别需要注意的,否则提示connect refuse错误
相关文章推荐
- Hadoop学习笔记-009-CentOS_6.5_64_HA高可用-Hadoop2.6+Zookeeper3.4.5安装Hive1.1.0
- Hadoop学习笔记之--Hadoop的安装
- Hadoop学习笔记———《Mac OS X 下hadoop2.6.0安装教程》
- hadoop 学习笔记002(安装和启动hadoop)
- Hadoop学习笔记一:准备工作之虚拟机安装Linux系统
- [原创] hadoop学习笔记:卸载和安装jdk
- hadoop学习笔记之Hbase安装
- Hadoop学习笔记(一)从官网下载安装包
- 【DAY1】hadoop的安装配置基础学习笔记
- [学习笔记]Hadoop安装_配置
- hadoop学习笔记之-生产环境Hadoop大集群配置安装
- Hadoop学习笔记-010-CentOS_6.5_64_HA高可用-Hadoop2.6+Zookeeper3.4.5安装Hbase1.0.0
- 【Linux学习笔记】Hadoop_安装,单机测试,伪分布式
- Hadoop学习笔记(3)hadoop伪分布模式安装
- hadoop学习笔记之初识hadoop hadoop单机版安装
- Hadoop学习笔记0001——Hadoop安装配置
- Hadoop学习笔记(一)----环境搭建之VMware虚拟机安装及创建CentOS
- hadoop学习笔记1----构造模块与集群安装ssh与启动Hadoop
- Hadoop学习笔记-Hadoop在Windows下安装
- Hadoop学习笔记-011-CentOS_6.5_64_HA高可用-Zookeeper3.4.5安装Kafka+消息监控KafkaOffsetMonitor