您的位置:首页 > 其它

MR-5.MapReduce分布式缓存(Distribute Cache)

2016-01-26 19:27 169 查看
DistributeCache是Hadoop的分布式文件缓存类,是一个提供给Map/Reduce框架的工具,用来缓存文件(文件,归档,jars等),DistributeCache将拷贝缓存的文件到slaves节点在任何job在节点上执行之前,每个存储在HDFS中的文件被放到缓存后都可以通过一个符号链接使用。



通过该类主要可以完成两方面的事情

(1) 完成分布式文件共享

(2) MR的Join操作,将小表放入cache中,可提高效率
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: