如何避免非GPU/NPU负载调度到GPU/NPU节点？

当集群中存在GPU/NPU节点和普通节点混合使用的场景时，普通工作负载也可以调度到GPU/NPU节点上，可能出现GPU/NPU资源未充分利用的情况。

由于GPU/NPU节点同样提供CPU、内存资源，在一般情况下，即使工作负载未声明使用GPU/NPU资源，调度器也会根据打分机制将工作负载调度到GPU/NPU节点运行，于是可能会出现GPU/NPU节点的CPU、内存资源被普通工作负载占用的情况，导致GPU/NPU资源闲置。

在使用GPU/NPU节点时，可以为其添加污点，并通过工作负载容忍度设置，避免非GPU/NPU工作负载调度到GPU/NPU节点上。

操作步骤如下：

登录CCE控制台，单击集群名称进入集群。
在左侧列表中选择“节点管理”，勾选GPU/NPU节点，并单击“标签与污点管理”。
单击“新增批量操作”，为GPU/NPU节点添加污点。

选择“污点(Taints)”，并填写键值与污点效果。示例中，为GPU/NPU节点添加accelerator=true:NoSchedule的污点。

图1 添加污点
创建GPU/NPU工作负载时，在高级配置中，手动添加容忍策略，容忍该污点。

图2 容忍策略
普通工作负载创建时，无需添加容忍策略。由于未容忍该污点，则不会被调度到GPU/NPU节点。

父主题：调度策略

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消