更新时间:2024-01-04 GMT+08:00

调度概述

CCE支持不同类型的资源调度及任务调度等,可提升应用的性能和集群整体资源的利用率。本文介绍CPU资源调度、GPU/NPU异构资源调度、Volcano调度的主要功能。

CPU调度

CCE提供CPU管理策略为应用分配完整的CPU物理核,提升应用性能,减少应用的调度延迟。

功能

描述

参考文档

CPU管理策略

当节点上运行了很多 CPU 密集的 Pod 时,工作负载可能会迁移到不同的 CPU 核。许多应用对这种迁移不敏感,因此无需任何干预即可正常工作。有些应用对CPU敏感,对于CPU敏感型应用,您可以利用Kubernetes中提供的CPU管理策略为应用分配独占核,提升应用性能,减少应用的调度延迟。

CPU管理策略

GPU调度

CCE为集群中的GPU异构资源提供调度能力,支持在容器中使用GPU显卡。

功能

描述

参考文档

Kubernetes默认GPU调度

Kubernetes默认GPU调度可以指定Pod申请GPU的数量,支持申请设置为小于1的数量,实现多个Pod共享使用GPU。

使用Kubernetes默认GPU调度

NPU调度

CCE为集群中的NPU异构资源提供调度能力,实现快速高效地处理推理和图像识别等工作。

功能

描述

参考文档

NPU调度

NPU调度可以指定Pod申请NPU的数量,为工作负载提供NPU资源。

NPU调度

Volcano调度

Volcano是一个基于Kubernetes的批处理平台,提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性,提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。

功能

描述

参考文档

使用Volcano调度工作负载

一般情况下,Kubernetes在调度工作负载时会使用自带的默认调度器,若需要使用Volcano调度器的能力,您可以为工作负载指定调度器。

使用Volcano调度工作负载

NUMA亲和性调度

Volcano可解决调度程序NUMA拓扑感知的限制,实现以下目标:

  • 避免将Pod调度到NUMA拓扑不匹配的节点。
  • 将Pod调度到NUMA拓扑的最佳节点。

NUMA亲和性调度