您的位置:首页 > 运维架构

如何学好hadoop开发(一)

2015-03-29 21:24 197 查看
由于大数据这个概念的兴起,越来越多的人想加入到大数据这个队伍里面,然而在大数据这个家族里面最有名的必然是HADOOP。整个HADOOP家族涉及到的领域比较多,例如类似数据仓库的HIVE,NOSQL的HBASE,关系型数据库到HADOOP平台的工具SQOOP,以及其他的相关组件如PIG、PHEONIX除此之外还有越来越火的SPARK,差点忘了还有FLUME或者STORM等等。单单是这些组件就已经让人眼花缭乱,应接不暇,其中任何一个组件都需要花费很多时间进行学习以及研究。

然而在时间过程中我发现了一个问题,很多凭借着满腔热血便加入到了HADOOP这个队伍中来。却忽视了一个简单的问题,那便是HADOOP相对较高的门槛。如熟悉LINUX系统、熟悉JAVA或者相关脚本语言如PYTHON、PERL等。除此之外没有具体的需求、在加上没有相关人员进行至少,至少我看来,这学起来可能比较吃力。

就拿一个简单的例子来说,有人不知道在LINUX下面用户之间如何配置互信,然后便是在ECLIPSE配置本地HADOOP测试环境,虽然这些都是很简单的问题,但是对于一个没有任何经验的新手来说,这可能需要花费几小时、甚至是一天的时间来解决这些问题。这是在学习过程中无法接受的。对于出入HADOO的同学来说,我们最主要的是实施能力:如搭建HADOOP环境,编写MAPREDUCE程序,然后写到HDFS上或者HBASE上。在这个过程中又会涉及到在32位系统下安装以及64为系统下面安装的不同问题,如(WARN
util.NativeCodeLoader: Unable to loadnative-hadoop library for your platform... using builtin-java classes whereapplicable),这些都是很难找到解决方法的。

其次便是在编写简单的MAPREDUCE过程中出现问题,无法解决。如本地编写MP报错

WARN mapred.LocalJobRunner: job_local1443194128_0001
java.lang.Exception: java.lang.RuntimeException: java.lang.NoSuchMethodException: MaxTemperature$TempMap.<init>()

这些都是在编程中出现的一些问题,都是需要自己花费很多时间来进行解决的,有的情况下自己甚至无法解决,打消自己学习HADOOP的信心以及激情。为此对于HADOOP初学者来说,需要一个老师,指导自己在学习HADOOP过程中遇到的问题,提高自己的学习效率。

恭喜你,现在这个机会来了。现正式推出HADOOP基础培训,为期一个月时间,让你从一个HADOOP小白到可以进行HADOOP的安装到开发,为你一个的HADOOP学习打下坚实的基础。

课程主要涉及:1、LINUX基础命令教学  2、HADOOP原理介绍(涉及上面提到的大多数组件)  3、HADOOP安装以及操作  4、MPR程序开发等

给您HADOOP学习打下坚实的基础,并且培训过程中提供源码以及相关材料。

################################################################################

小P工作室现推出基础HADOOP基础培训课程,方便您快速入门。

 HADOOP沟通交流群 :435930931   QQ :1400184751 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  hadoop hdfs linux 培训