更新时间:2024-06-12 GMT+08:00
分享

准备GPU虚拟化资源

本文介绍如何在使用GPU虚拟化能力前所需要的基础软件、硬件规划与准备工作。

基础规划

配置

支持版本

集群版本

v1.25.15-r7及以上

操作系统

Huawei Cloud EulerOS 2.0

GPU类型

T4、V100

GPU驱动版本

470.57.02、470.103.01、470.141.03、510.39.01、510.47.03

容器运行时

containerd

插件

集群中需要同时安装以下插件:

步骤一:纳管并标记GPU节点

如果您的集群中已有符合基础规划的GPU节点,您可以跳过此步骤。

  1. 在集群中纳管支持GPU虚拟化的节点,具体操作步骤请参见纳管节点
  2. 纳管成功后,给对应支持GPU虚拟化节点打上“accelerator: nvidia-{显卡型号}”标签,具体操作步骤请参见为节点添加标签/污点

    图1 为虚拟化节点打标签

步骤二:安装插件

如果您的集群中已安装符合基础规划的插件,您可以跳过此步骤。

更改驱动版本后,需要重启节点才能生效。

  1. 登录UCS控制台,单击集群名称进入集群,在左侧导航栏中选择“插件管理”,查看“已安装插件”中是否存在volcano插件与gpu-device-plugin插件。
  2. 若未安装volcano插件,请安装该插件,具体操作请参见volcano

    若未安装gpu-device-plugin插件,请安装该插件,具体操作请参见gpu-device-plugin

分享:

    相关文档

    相关产品