urable 接口,少了 setConf()
方法;FifoScheduler
不支持资源抢占,FairScheduler
支持资源抢占却没实现 PreemptableResourceScheduler
接口。
在 YarnScheduler
中,定义了一个资源调度器应该实现的方法。在 AbstractYarnScheduler
中实现了大部分方法,若自己实现调度器可继承该类,将发开重点放在资源分配实现上。
public interface YarnScheduler extends EventHandler<SchedulerEvent> {
// 获得一个队列的基本信息
public QueueInfo getQueueInfo(String queueName, boolean includeChildQueues,
boolean recursive) throws IOException;
// 获取集群资源
public Resource getClusterResource();
/**
* AM 和资源调度器之间最主要的一个方法
* AM 通过该方法更新资源请求、待释放资源列表、黑名单列表增减
*/
@Public
@Stable
Allocation allocate(ApplicationAttemptId appAttemptId,
List<ResourceRequest> ask, List<ContainerId> release,
List<String> blacklistAdditions, List<String> blacklistRemovals,
List<UpdateContainerRequest> increaseRequests,
List<UpdateContainerRequest> decreaseRequests);
// 获取节点资源使用情况报告
public SchedulerNodeReport getNodeReport(NodeId nodeId);
ResourceScheduler
本质是个事件处理器,主要处理10种事件(CapacityScheduler 还会多处理几种抢占相关的事件),可以到对应 Scheduler 的 handle()
方法中查看这些事件处理逻辑:
NODE_ADDED
: 集群中增加一个节点
NODE_REMOVED
: 集群中移除一个节点
NODE_RESOURCE_UPDATE
: 集群中有一个节点的资源增加了
NODE_LABELS_UPDATE
: 更新node labels
NODE_UPDATE
: 该事件是 NM 通过心跳和 RM 通信时发送的,会汇报该 node 的资源使用情况,同时触发一次分配操作。
APP_ADDED
: 增加一个Application
APP_REMOVED
: 移除一个application
APP_ATTEMPT_ADDED
: 增加一个application Attempt
APP_ATTEMPT_REMOVED
: 移除一个application attempt
CONTAINER_EXPIRED
: 回收一个超时的container
三、资源调度维度
目前有两种:DefaultResourceCalculator
和 DominantResourceCalculator
。
DefaultResourceCalculator
: 仅考虑内存资源
DominantResourceCalculator
: 同时考虑内存和 CPU 资源(后续更新中支持更多类型资源,FPGA、GPU 等)。该算法扩展了最大最小公平算法(max-min fairness)。
(这里注意!很多文章和书中写的是「YARN 资源调度器默认采用了 DominantResourceCalculator」,实际并不是这样的!)
FifoScheduler
默认使用 DefaultResourceCalculator
且不可更改。
CapacityScheduler
是在 capacity-scheduler.xml
中配置 yarn.scheduler.capacity.resource-calculator
参数决定的。
FairScheduler
才默认使用 DominantResourceCalculator
。
四、资源抢占模型
这里仅简要介绍资源抢占模型,在后面的文章中会深入源码分析抢占的流程。
- 在资源调度器中,每个队列可设置一个最小资源量和最大资源量,其中,最小资源量是资源紧缺情况下每个队列需保证的资源量,而最大资源量则是极端情况下队列也不能超过的资源使用量
- 为了提高资源利用率,资源调度器(包括Capacity Scheduler和Fair Scheduler)会将负载较轻的队列的资源暂时分配给负载重的队列,仅当负载较轻队列突然收到新提交的应用程序时,调度器才进一步将本属于该队列的资源分配给它。
五、总结
本文介绍了 Yarn 资源调度器的基本框架,包括基本架构,以及简要介绍三种 YARN 实现的调度器,并对资源调度维度,资源抢占模型等进行了介绍。
后续文章中将会围绕三种 YARN 调度器,深入源码进行探究。看其在源码中是如何一步步实现对应功能的。
参考文章:
《Hadoop 技术内幕:深入解析 YARN 架构设计与实现原理》第六章
深入解析yarn架构设计与技术实现-资源调度器
Yarn源码分析5-资源调度