您的位置：首页 > 运维架构

HADOOP的数据流

2015-12-08 15:53 288 查看

　　HDFS在InputFormat(将data转换为<key,value>)等支持下，将数据块传入MAPPER中，MAPPER输出<key, value>到内存，如果发生spill则存入本地文件, 形成较大文件region(可能有combine发生)。之后的去向分为两种，一种是本机有reduce，则加入到reduce的内存中；另外一种是远程复制到别的机器上的reduce中。经过merge和sort, 由reduce处理，并将数据写会HDFS。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

Centos 安装配置Samba
@property,autorelease 知识点总结
VirtualBox虚拟机找不到网卡的解决方法--centos6.5
关于linux iptables中dport和sport
opencv Mat 内存分配
运维人员如何提高自己水平？？
Centos6.4(64bit)安装Python2.7.10 & tornado-4.3
run loop详解
Web网站开发组合方式
Cacti报警设置
学习网站
cacti监控找到网卡的方法
【HBase】1009-HBase的协处理器（coprocessor）统计行数
ubuntu 14.04 安装交叉编译工具链arm-none-linux-gnueabi
Tomcat多实例运行配置
Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask
linux（centos）搭建SVN服务器
Linux下启动tomcat的方法
open-falcon的学习
linux下关于DM8168和PC通信的NFS环境的配置

新的分享

新鲜开源：基于Prometheus的企业监控平台设计与实现 - 运维
民生银行日接入量15T的ELK日志平台（Apollo+ES源码改造） - 运维
邱盛昌：OPPO商业化数据体系建设实战
一篇吃透监控系统：常用组合方案和主流工具选型 - 运维
DevOps落地成不成，关键不在持续集成？ - 运维
mlops的一些记录
用Prometheus监控K8S，目前最实用的部署方式都说全了（有彩蛋） - 运维
asio 使用 openssl 示例
Netty源码研究笔记（4）——EventLoop系列
许北林：我为什么加入OpenHarmony生态？又为什么要做“启航KP”开发套件？
【直播回顾】OpenHarmony知识赋能五期第五课——多媒体子系统之视频解读
【直播回顾】如何成为一名优秀的OpenHamrony贡献者？

章节导航