设为首页 加入收藏

TOP

【深入浅出 Yarn 架构与实现】5-1 Yarn 资源调度器基本框架(二)
2023-07-25 21:36:51 】 浏览:39
Tags:Yarn 5-1
urable 接口,少了 setConf() 方法;FifoScheduler 不支持资源抢占,FairScheduler 支持资源抢占却没实现 PreemptableResourceScheduler 接口。
image.png

image.png

image.png

YarnScheduler 中,定义了一个资源调度器应该实现的方法。在 AbstractYarnScheduler 中实现了大部分方法,若自己实现调度器可继承该类,将发开重点放在资源分配实现上。

public interface YarnScheduler extends EventHandler<SchedulerEvent> {
  // 获得一个队列的基本信息
  public QueueInfo getQueueInfo(String queueName, boolean includeChildQueues,
      boolean recursive) throws IOException;

  // 获取集群资源
  public Resource getClusterResource();

  /**
   * AM 和资源调度器之间最主要的一个方法
   * AM 通过该方法更新资源请求、待释放资源列表、黑名单列表增减
   */
  @Public
  @Stable
  Allocation allocate(ApplicationAttemptId appAttemptId,
      List<ResourceRequest> ask, List<ContainerId> release,
      List<String> blacklistAdditions, List<String> blacklistRemovals,
      List<UpdateContainerRequest> increaseRequests,
      List<UpdateContainerRequest> decreaseRequests);

  // 获取节点资源使用情况报告
  public SchedulerNodeReport getNodeReport(NodeId nodeId);

ResourceScheduler 本质是个事件处理器,主要处理10种事件(CapacityScheduler 还会多处理几种抢占相关的事件),可以到对应 Scheduler 的 handle() 方法中查看这些事件处理逻辑:

  • NODE_ADDED: 集群中增加一个节点
  • NODE_REMOVED: 集群中移除一个节点
  • NODE_RESOURCE_UPDATE: 集群中有一个节点的资源增加了
  • NODE_LABELS_UPDATE: 更新node labels
  • NODE_UPDATE: 该事件是 NM 通过心跳和 RM 通信时发送的,会汇报该 node 的资源使用情况,同时触发一次分配操作。
  • APP_ADDED: 增加一个Application
  • APP_REMOVED: 移除一个application
  • APP_ATTEMPT_ADDED: 增加一个application Attempt
  • APP_ATTEMPT_REMOVED: 移除一个application attempt
  • CONTAINER_EXPIRED: 回收一个超时的container

三、资源调度维度

目前有两种:DefaultResourceCalculatorDominantResourceCalculator

  • DefaultResourceCalculator: 仅考虑内存资源
  • DominantResourceCalculator: 同时考虑内存和 CPU 资源(后续更新中支持更多类型资源,FPGA、GPU 等)。该算法扩展了最大最小公平算法(max-min fairness)。
    • 在 DRF 算法中,将所需份额(资源比例)最大的资源称为主资源,而 DRF 的基本设计思想则是将最大最小公平算法应用于主资源上,进而将多维资源调度问题转化为单资源调度问题,即 DRF 总是最大化所有主资源中最小的
    • 感兴趣的话,可到源码中 DominantResourceCalculator#compare 探究实现逻辑
    • 对应的论文 《Dominant Resource Fairness: Fair Allocation of Multiple Resource Types》

(这里注意!很多文章和书中写的是「YARN 资源调度器默认采用了 DominantResourceCalculator」,实际并不是这样的!)

  • FifoScheduler 默认使用 DefaultResourceCalculator 且不可更改。
  • CapacityScheduler 是在 capacity-scheduler.xml 中配置 yarn.scheduler.capacity.resource-calculator 参数决定的。
  • FairScheduler 才默认使用 DominantResourceCalculator

四、资源抢占模型

这里仅简要介绍资源抢占模型,在后面的文章中会深入源码分析抢占的流程。

  • 在资源调度器中,每个队列可设置一个最小资源量和最大资源量,其中,最小资源量是资源紧缺情况下每个队列需保证的资源量,而最大资源量则是极端情况下队列也不能超过的资源使用量
  • 为了提高资源利用率,资源调度器(包括Capacity Scheduler和Fair Scheduler)会将负载较轻的队列的资源暂时分配给负载重的队列,仅当负载较轻队列突然收到新提交的应用程序时,调度器才进一步将本属于该队列的资源分配给它。

五、总结

本文介绍了 Yarn 资源调度器的基本框架,包括基本架构,以及简要介绍三种 YARN 实现的调度器,并对资源调度维度,资源抢占模型等进行了介绍。
后续文章中将会围绕三种 YARN 调度器,深入源码进行探究。看其在源码中是如何一步步实现对应功能的。


参考文章:
《Hadoop 技术内幕:深入解析 YARN 架构设计与实现原理》第六章
深入解析yarn架构设计与技术实现-资源调度器
Yarn源码分析5-资源调度

首页 上一页 1 2 下一页 尾页 2/2/2
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇keyclaok~web安全防护 下一篇每日算法之二叉搜索树的后序遍历..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目