管理超节点池和超节点
CCE Standard/Turbo集群通过超节点池的形式管理超节点(Snt9b23)。在CCE中,可以通过超节点池查看超节点的规格等信息,并对超节点内单节点进行标签管理、污点管理、节点排水等操作。
前提条件
- 已在ModelArts服务中购买Lite Cluster集群,并已创建相应的超节点池和超节点,具体请参见Lite Cluster资源开通。
约束与限制
- CCE暂未开放超节点及超节点池的创建和删除入口,请通过ModelArts服务进行超节点及超节点池的创建和删除,具体请参见Lite Cluster资源开通和Lite Cluster资源管理。
- CCE暂不支持超节点的计费模式转换、同步云服务器、开启节点缩容保护、移除和迁移等操作。
- 如果需要为超节点提供云原生AI的增强能力,请安装云原生AI插件。
管理超节点池
在超节点池中,可以查看超节点池规格、超节点数量、NPU卡数、超节点列表及事件等信息。具体步骤如下:
- 登录CCE控制台,单击集群名称进入集群。
- 在左侧导航栏,选择“节点管理 > 节点池”。在节点池列表中,可以查看对应超节点池。在超节点池中呈现了超节点池的详细信息,包含超节点池规格、超节点数量、超节点列表及事件等。
图1 超节点池
- 在对应超节点池中单击“超节点列表”,查看超节点的相关信息,如内部节点数量等。
图2 超节点列表
- 在超节点操作列单击“节点列表”,可以查看对应超节点内节点的详细信息,如CPU申请/限制、内存申请/限制及节点OS版本等信息。
图3 超节点内节点列表
管理超节点内的节点
|
操作 |
描述 |
|---|---|
|
禁止调度 |
可以将节点设置为不可调度,从而使工作负载无法调度至该节点。 操作步骤: 进入节点列表中,在对应节点的操作列单击“更多 > 禁止调度”。在“禁止调度”弹窗中,单击“确定”。 如果需要重新开启调度,在对应节点的操作列单击“更多 > 开启调度”即可。 |
|
标签管理 |
给节点设置不同的标签,每个标签代表不同的属性。通过标签,您可以快速地了解各个节点的特点。 更多信息,请参见管理节点标签。 |
|
污点管理 |
为节点配置污点,污点能够使节点排斥某些特定的Pod,从而避免Pod调度到该节点上。 更多信息,请参见管理节点污点。 |
|
节点排水 |
在节点故障等场景下,该功能可帮助您快速排空节点,将故障节点进行隔离,原节点上被驱逐的Pod将会由工作负载controller转移到其他正常可调度的节点上。 更多信息,请参见节点排水。 |