Apache Hadoop Pig 源代码分析(1)
2014-09-23 11:06
239 查看
由于工作中需要使用Pig工具,为了加深对Pig的理解,现在尝试分析它的源代码,以最新发布的0.13.0版为基础。
Pig是什么,源代码怎样获取,我就不多说了,Google或百度一下即可找到。
拿到源代码后,首先统计java文件的个数,总共有1504个!!!
这么多代码还要继续分析吗?当然要继续了,不要怕,其实里面很多辅助文件和小文件。
比如以Test开头的文件,绝大多数是用来进行单元测试的,跟核心代码无关,可以删除掉;有很多文件只是简单的定义了一个接口,没有多少内容。
在这里我推荐使用Everything这个文件查询工具来进行文件的统计和过滤,非常方便。
删除掉Test文件后,还剩1157个,少了300多个,请看下图。
为下一步开始分析代码开了一个好头。
Pig是什么,源代码怎样获取,我就不多说了,Google或百度一下即可找到。
拿到源代码后,首先统计java文件的个数,总共有1504个!!!
这么多代码还要继续分析吗?当然要继续了,不要怕,其实里面很多辅助文件和小文件。
比如以Test开头的文件,绝大多数是用来进行单元测试的,跟核心代码无关,可以删除掉;有很多文件只是简单的定义了一个接口,没有多少内容。
在这里我推荐使用Everything这个文件查询工具来进行文件的统计和过滤,非常方便。
删除掉Test文件后,还剩1157个,少了300多个,请看下图。
为下一步开始分析代码开了一个好头。
相关文章推荐
- Apache Hadoop Pig 源代码分析(2)
- hadoop源代码分析(4)-org.apache.hadoop.util包-GenericOptionsParser类【原创】
- Apache源代码全景分析 第1卷 体系结构和核心模块 封面
- Apache源代码全景分析第一卷 开始接受预定
- Hadoop源代码分析(二)
- Hadoop源代码分析【RPC】
- Hadoop源代码分析【RPC】
- Hadoop源代码分析【IO专题】
- Apache源代码分析——模块的加载
- Hadoop源代码分析(mapreduce.lib.partition/reduce/output)
- Hadoop源代码分析 - MapReduce(转载)
- Hadoop源代码分析
- piglatin.php源代码分析
- Hadoop源代码分析(三)
- Hadoop源代码分析(二)
- Hadoop源代码分析(一)
- Apache源代码分析
- Hadoop源代码分析(一)
- apache的..%5c漏洞原因源代码分析
- Hadoop源代码分析【IO专题-SequenceFile】