更新时间:2025-07-07 GMT+08:00
异构资源配置
GPU配置
- GPU虚拟化:CCE GPU虚拟化采用自研xGPU虚拟化技术,能够动态对GPU设备显存与算力进行划分,单个GPU卡最多虚拟化成20个GPU虚拟设备。相对于静态分配来说,虚拟化的方案更加灵活,最大程度保证业务稳定的前提下,可以完全由用户自己定义使用的GPU量,提高GPU利用率。详情请参见GPU虚拟化概述。
- 集群默认驱动:集群中GPU节点默认使用的GPU驱动版本。如果选择“自定义驱动链接地址”,则需填写Nvidia驱动的下载链接,详情请参见获取驱动链接-公网地址。
- 节点池配置:若您不希望集群中的所有GPU节点使用相同的驱动,CCE支持以节点池为单位安装不同的GPU驱动。配置节点池自定义驱动后,节点池中节点优先使用当前节点池自定义驱动,未指定驱动的节点将使用集群默认驱动。
- 系统将根据节点池指定的驱动版本进行安装,仅对节点池新建节点生效。
- 更新驱动版本后,新建节点直接生效,存量节点需重启节点生效。
- 安装2.7.2及以上版本的CCE AI套件(NVIDIA GPU)插件时,支持以节点池级别配置GPU虚拟化开关。
父主题: 配置中心