您的位置:首页 > 运维架构 > Apache

Apache Hadoop Pig 源代码分析(1)

2014-09-23 11:06 239 查看
由于工作中需要使用Pig工具,为了加深对Pig的理解,现在尝试分析它的源代码,以最新发布的0.13.0版为基础。

Pig是什么,源代码怎样获取,我就不多说了,Google或百度一下即可找到。

拿到源代码后,首先统计java文件的个数,总共有1504个!!!

这么多代码还要继续分析吗?当然要继续了,不要怕,其实里面很多辅助文件和小文件。

比如以Test开头的文件,绝大多数是用来进行单元测试的,跟核心代码无关,可以删除掉;有很多文件只是简单的定义了一个接口,没有多少内容。

在这里我推荐使用Everything这个文件查询工具来进行文件的统计和过滤,非常方便。

删除掉Test文件后,还剩1157个,少了300多个,请看下图。



为下一步开始分析代码开了一个好头。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: