hadoop 学习笔记1 —— ubuntu上构建伪分布式的hadoop安装
2014-03-01 09:37
525 查看
(一)配置hadoop运行环境
i)因为hadoop是用java编写的,所以在装hadoop之前,首先需要安装java环境
1 安装jdk, 在http://www.oracle.com/technetwork/java/javase/downloads/index.html上下载最新的jdk安装
2 设置java运行环境,即在/etc/environment 或者 /etc/profile 或者 home目录即~/.bashrc 文件中设置JAVA_HOME、CLASSPATH、PATH环境变量
需要注意这三个文件的区别。
3 下载hadoop,在apache官网很容易下载hadoop的压缩包,然后可以新建一个hadoop用户和hadoop用户组,将hadoop解压到hadoop用户的home目录下面
4 修改hadoop运行环境变量,其实只要在hadoop的安装文件所在的目录下的conf目录中的hadoop-env.sh中加入export JAVA_HOME=你真实的JDK安装目录
ii)因为hadoop运行需要无命令的ssh,所以下面安装和配置ssh
iii)配置hadoop伪分布模式
进入hadoop的安装目录,以hadoop身份
1、修改conf/core-site.xml为:
2、修改conf/hdfs-site.xml为:
3、修改conf/mapred-site.xml为:
4、格式化hadoop的hdfs
(二)启动hadoop
从上面的输出可以看到日志文件在哪里?
查看hadoop各个进程是否都已经启动完毕:
如果出现上面的所有进程,表示你已经安装好了hadoop
如果有问题,请查看日志,我的问题是datanode没有启动,原因是有一个文件的权限设置有问题,改过来,重新格式化hdfs即可
i)因为hadoop是用java编写的,所以在装hadoop之前,首先需要安装java环境
1 安装jdk, 在http://www.oracle.com/technetwork/java/javase/downloads/index.html上下载最新的jdk安装
2 设置java运行环境,即在/etc/environment 或者 /etc/profile 或者 home目录即~/.bashrc 文件中设置JAVA_HOME、CLASSPATH、PATH环境变量
需要注意这三个文件的区别。
3 下载hadoop,在apache官网很容易下载hadoop的压缩包,然后可以新建一个hadoop用户和hadoop用户组,将hadoop解压到hadoop用户的home目录下面
4 修改hadoop运行环境变量,其实只要在hadoop的安装文件所在的目录下的conf目录中的hadoop-env.sh中加入export JAVA_HOME=你真实的JDK安装目录
ii)因为hadoop运行需要无命令的ssh,所以下面安装和配置ssh
sudo apt-get install ssh sudo apt-get install rsync ssh-keygen -t rsa -P ' ' -f ~/.ssh/id_rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_key ssh localhost
iii)配置hadoop伪分布模式
进入hadoop的安装目录,以hadoop身份
1、修改conf/core-site.xml为:
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/home/hadoop/hadoop/tmp</value> </property> </configuration>
2、修改conf/hdfs-site.xml为:
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.name.dir</name> <value>/home/hadoop/hadoop/hdfs/name</value> </property> <property> <name>dfs.data.dir</name> <value>/home/hadoop/hadoop/hdfs/data</value> </property> <property> <name>dfs.permissions</name> <value>false</value> </property> </configuration>
3、修改conf/mapred-site.xml为:
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> </configuration>
4、格式化hadoop的hdfs
hadoop namenode -format
(二)启动hadoop
hadoop@clebeg:~/hadoop$ bin/start-all.sh Warning: $HADOOP_HOME is deprecated. starting namenode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-namenode-clebeg.out localhost: Warning: $HADOOP_HOME is deprecated. localhost: localhost: starting datanode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-datanode-clebeg.out localhost: Warning: $HADOOP_HOME is deprecated. localhost: localhost: starting secondarynamenode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-secondarynamenode-clebeg.out starting jobtracker, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-jobtracker-clebeg.out localhost: Warning: $HADOOP_HOME is deprecated. localhost: localhost: starting tasktracker, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-tasktracker-clebeg.out
从上面的输出可以看到日志文件在哪里?
查看hadoop各个进程是否都已经启动完毕:
hadoop@clebeg:~/hadoop$ jps 5250 JobTracker 5407 TaskTracker 4816 NameNode 4988 DataNode 5594 Jps 5156 SecondaryNameNode
如果出现上面的所有进程,表示你已经安装好了hadoop
如果有问题,请查看日志,我的问题是datanode没有启动,原因是有一个文件的权限设置有问题,改过来,重新格式化hdfs即可
相关文章推荐
- Hadoop学习笔记_Ubuntu下伪分布式安装及配置
- hadoop学习笔记之二:安装伪分布式
- 1.hadoop伪分布式安装命令(hadoop学习笔记)
- 开始hadoop前的准备:ubuntu学习笔记-基本环境的搭建(ssh的安装,SecureCRT连接,vim的安装及使用、jdk的安装)
- 【Linux学习笔记】Hadoop_安装,单机测试,伪分布式
- Hadoop学习笔记【12】-Hadoop2.1全分布式集群安装
- Hadoop伪分布式安装学习笔记一
- Ubuntu环境Hadoop全分布式环境搭建 (学习笔记)
- Hadoop学习笔记_伪分布式安装
- hadoop学习笔记一之ubuntu下安装jdk
- hadoop学习笔记之前期准备 ubuntu16.04虚拟机安装、WMwareTools安装及网络配置
- hadoop2.4.1伪分布式安装,hdfs命令行操作学习笔记
- Hadoop学习笔记【12】-Hadoop2.1全分布式集群安装
- 大数据学习之hadoop伪分布式集群安装(一)
- hadoop 学习(二)ubuntu hadoop 2.7.0 伪分部安装
- ubuntu下hadoop安装与伪分布式的配置
- hadoop学习准备环境:ubuntu学习笔记-基本环境的搭建
- ubuntu操作系统学习笔记之NFS安装
- Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
- Hadoop学习笔记——安装Hadoop