Hadoop集群问题汇总
2013-12-14 14:39
239 查看
原则
①.不能随便使用hadoop namenode -format命令,该命令将格式化hdfs,所有数据都将失去。(该命令相当万能,就跟在windows下遇到问题就重装系统一样)
②.
1、NameNode、DataNode迁移问题
问题A、Hadoop集群搭建好之后,默认路径采用的是/tmp,但该文件夹在Linux系统重启的时候会清空,所以需要转移到其他文件夹。
问题B、Hadoop集群搭建好之后,由于公司的服务器命名需要规范化,需要修改主机名。直接修改后,使用Hive的时候发现内部数据查找的时候链接的是原来的主机名。
上面两个问题,分析其本质发现问题A是DataNode迁移,问题B是NameNode迁移。
具体解决方法如下:
Datanode迁移:
①.首先停掉Hadoop集群,然后指定一个新文件夹来保存数据,比如/usr/local/Hadoop/data
②.将/tmp文件夹下的文件都拷贝到新文件夹下
③.修改Hadoop的conf下的core-site.xml文件,将hadoop.tmp.dir修改为新的文件夹(如果你在hdfs-site.xml里面配置了路径,那就修改hdfs-site.xml里面的dfs.data.dir)
NameNode迁移:
①.前面几步和DataNode迁移类似
②.Hive的元数据metadata是用mysql来保存的,链接信息写死在hive数据库的DBS和SBS表里,所以需要手动去mysql中更新这些信息。
update DBS set DB_LOCATION_URI=REPLACE(DB_LOCATION_URI,'old host','new host');
update SDS set LOCATION=REPLACE(LOCATION,'old host','new host');
①.不能随便使用hadoop namenode -format命令,该命令将格式化hdfs,所有数据都将失去。(该命令相当万能,就跟在windows下遇到问题就重装系统一样)
②.
1、NameNode、DataNode迁移问题
问题A、Hadoop集群搭建好之后,默认路径采用的是/tmp,但该文件夹在Linux系统重启的时候会清空,所以需要转移到其他文件夹。
问题B、Hadoop集群搭建好之后,由于公司的服务器命名需要规范化,需要修改主机名。直接修改后,使用Hive的时候发现内部数据查找的时候链接的是原来的主机名。
上面两个问题,分析其本质发现问题A是DataNode迁移,问题B是NameNode迁移。
具体解决方法如下:
Datanode迁移:
①.首先停掉Hadoop集群,然后指定一个新文件夹来保存数据,比如/usr/local/Hadoop/data
②.将/tmp文件夹下的文件都拷贝到新文件夹下
③.修改Hadoop的conf下的core-site.xml文件,将hadoop.tmp.dir修改为新的文件夹(如果你在hdfs-site.xml里面配置了路径,那就修改hdfs-site.xml里面的dfs.data.dir)
NameNode迁移:
①.前面几步和DataNode迁移类似
②.Hive的元数据metadata是用mysql来保存的,链接信息写死在hive数据库的DBS和SBS表里,所以需要手动去mysql中更新这些信息。
update DBS set DB_LOCATION_URI=REPLACE(DB_LOCATION_URI,'old host','new host');
update SDS set LOCATION=REPLACE(LOCATION,'old host','new host');
相关文章推荐
- Hadoop、Spark 集群环境搭建问题汇总
- Hadoop2.7.2 Centos 完全分布式集群环境搭建 (3) - 问题汇总
- hadoop集群环境安装 遇到的问题汇总
- Hadoop集群搭建及测试过程中碰到的问题汇总
- hadoop2.7.3分布式集群问题汇总(持续更新)
- Hadoop 集群问题汇总
- mac中myeclipse10连接hadoop-2.6.0集群开发环境问题汇总
- Hadoop集群搭建过程中的常见问题(一)
- Hadoop问题汇总
- hadoop 日常问题汇总(持续更新)
- hadoop集群小项目实践及遇到问题解决办法
- 高可用性hadoop集群问题
- hadoop搭建中遇到的问题汇总
- centos7 安装hadoop 集群遇到的问题
- CentOS搭建Hadoop分布式集群详细步骤和常见问题解决
- Hadoop大数据框架研究(6)——Hadoop环境部署问题汇总
- 关于VMWare虚拟机下搭建hadoop集群练习各虚拟机间无法ping通主机名的问题
- sqoop1.4.4导出mysql数据到hadoop1.2.1集群出现的问题
- Hadoop集群中改变了其中一个节点的主机名之后 的ssh连接问题
- hadoop集群启动脚本——解决启动hadoop集群时,效率低问题