Skip to content

天楚锐齿

人工智能 云计算 大数据 物联网 IT 通信 嵌入式

天楚锐齿

  • 下载
  • 物联网
  • 云计算
  • 大数据
  • 人工智能
  • Linux&Android
  • 网络
  • 通信
  • 嵌入式
  • 杂七杂八

Hadoop性能模型(3)

2018-03-12

2.3 Merge阶段模型

merge阶段的目标是合并所有spill文件到一个单一的输出文件,写入本地磁盘。多于一个spill文件的时候就会发生merge,也许会有多次merge,取决于pSortFactor参数。定义一次merge最多合并pSortFactor决定的spill文件数。定义一轮merge为一次或多次merge,在spill阶段再产生spill文件或前一轮spill再产生spill文件的话就会有多轮merge出现。例如,假定numSpills=30、pSortFactor=10,因此3个merge会执行,建立三个新文件,这是第一轮,接着,三个新文件将merge到一起,这是第二轮,也是最后一轮。

如果最后一次需要合并的spill数量大于等于pNumSpillsForComb,combiner需要再次使用。进一步,我们把中间merge和最后merge分开。中间merge,我们计算单个spill将被读多少次。

接下来的部分假定numSpills<=pSortFactor,这种情况下,为了计算在中间merge阶段spills数量,我们使用仿真方法。

第一次merge是统一的,因为hadoop会计算优化spill文件数用来合并,以便所有merge都刚好是pSortFactor个文件。
既然Reduce也会包含一个类似的Merge阶段,定义三个公式,之后可以重用:

第一次merge期间spill文件数:

中间merge期间spill文件数:

merge总数:

最后一轮merge的spill文件数(第一次+中间+余下的spill文件):

总的spill过的记录数:

最终map输出大小和k-v对数:

该阶段的消耗:

2.4 整个map阶段模型

Post navigation

Previous Post:

Hadoop性能模型(2)

Next Post:

Hadoop性能模型(4)

发表回复 取消回复

要发表评论,您必须先登录。

个人介绍

需要么,有事情这里找联系方式:关于天楚锐齿

=== 美女同欣赏,好酒共品尝 ===

微信扫描二维码赞赏该文章:

扫描二维码分享该文章:

分类

  • Linux&Android (84)
  • Uncategorized (1)
  • 下载 (28)
  • 云计算 (39)
  • 人工智能 (10)
  • 大数据 (36)
  • 嵌入式 (34)
  • 杂七杂八 (35)
  • 物联网 (65)
  • 网络 (28)
  • 通信 (22)

归档

近期文章

  • 安装JumpServer作为堡垒机
  • xshell通过SOCKS隧道和代理实现ssh登录其他内网服务器
  • 使用stub_status和vts模块进行nginx性能监控
  • 国内使用Google的Gemini AI下AntiGravity的方式
  • 抖店云的虚机用Nginx代理解码抖店订单

近期评论

  • linux爱好者 发表在《Linux策略路由及iptables mangle、ip rule、ip route关系及一种Network is unreachable错误》
  • maxshu 发表在《使用Android的HIDL+AIDL方式编写从HAL层到APP层的程序》
  • Ambition 发表在《使用Android的HIDL+AIDL方式编写从HAL层到APP层的程序》
  • Ambition 发表在《使用Android的HIDL+AIDL方式编写从HAL层到APP层的程序》
  • maxshu 发表在《Android9下用ethernet 的Tether模式来做路由器功能》

阅读量

  • 使用Android的HIDL+AIDL方式编写从HAL层到APP层的程序 - 26,027次阅读
  • 卸载深信服Ingress、SecurityDesktop客户端 - 20,243次阅读
  • 车机技术之车规级Linux-Automotive Grade Linux(AGL) - 11,779次阅读
  • 在Android9下用ndk编译vSomeIP和CommonAPI以及使用例子 - 10,154次阅读
  • linux下的unbound DNS服务器设置详解 - 10,032次阅读
  • linux的tee命令导致ssh客户端下的shell卡住不动 - 9,308次阅读
  • Linux策略路由及iptables mangle、ip rule、ip route关系及一种Network is unreachable错误 - 9,071次阅读
  • 车机技术之360°全景影像(环视)系统 - 9,032次阅读
  • Windows下安装QEMU并在qemu上安装ubuntu和debian - 8,596次阅读
  • 车机技术之Android Automotive - 8,507次阅读

其他操作

  • 注册
  • 登录
  • 条目 feed
  • 评论 feed
  • WordPress.org

联系方式

地址
深圳市科技园

时间
周一至周五:  9:00~12:00,14:00~18:00
周六和周日:10:00~12:00

标签

android AT命令 CAN centos Hadoop hdfs ip ipv6 java kickstart linux mapreduce mini6410 modem nova OAuth openstack python socket ssh uboot 使用 内核 协议 安装 嵌入式 性能 报表 授权 数据 数据库 月报 模型 汽车 深度学习 源代码 统计 编译 网络 脚本 虚拟机 调制解调器 车机 迁移 金融
© 2026 天楚锐齿 | Powered by WordPress | Theme by MadeForWriters