更新时间:2024-06-17 GMT+08:00
分享

选择GPU节点驱动版本

使用GPU加速型云服务器时,需要安装正确的Nvidia基础设施软件,才可以使用GPU实现计算加速功能。在使用GPU前,您需要根据GPU型号,选择兼容配套软件包并安装。

本文将介绍如何选择GPU节点的驱动版本及配套的CUDA Toolkit。

如何选择GPU节点驱动版本

一般情况下,使用GPU资源时您将会使用以下软件包,并且软件包版本需要保持配套:

  • 驱动GPU工作的硬件驱动程序,如Tesla系列驱动。
  • 上层应用程序所需要的库,如CUDA Toolkit工具包。

在容器使用场景下,GPU驱动是安装在节点上的,而CUDA Toolkit一般会在应用程序的容器镜像构建时预安装,或者可直接使用Nvidia官方已预装CUDA Toolkit的基础镜像构建应用容器镜像。GPU驱动和CUDA Toolkit版本需要配套才可以正常使用GPU资源。

您可以使用nvidia-smi命令查看的节点上驱动信息,确定Nvidia驱动与CUDA Toolkit版本的配套关系,如下图,驱动版本为470.141.03, 对应支持的CUDA Toolkit最大版本为11.4。

图1 Nvidia驱动与CUDA Toolkit版本的配套关系

CUDA Toolkit和驱动的版本兼容性列表

在选择Nvidia驱动时,需要保证驱动版本兼容CUDA Toolkit版本,官方提供配套关系如下表。该表展示了CUDA Toolkit版本兼容的最低驱动版本,如需更精确的版本对照表,请参见CUDA Toolkit和驱动的版本兼容性列表。您可以根据应用所使用的CUDA Toolkit版本,选择合适的NVIDIA驱动版本。

在选择Nvidia驱动时,建议您在满足下表中CUDA版本和驱动版本配套关系的前提下,优先选择CCE推荐的GPU驱动版本列表中提供的GPU驱动版本。若CCE推荐的驱动版本无法匹配您使用的CUDA Toolkit版本,必须使用非推荐的驱动版本,则需要您自行验证机型、系统及驱动版本间的配套兼容性。

CUDA Toolit版本

兼容性所需的最低驱动版本(Linux x86_64)

CUDA 12.x

>=525.60.13

CUDA 11.8.x

CUDA 11.7.x

CUDA 11.6.x

CUDA 11.5.x

CUDA 11.4.x

CUDA 11.3.x

CUDA 11.2.x

CUDA 11.1.x

>=450.80.02

CUDA 11.0

>=450.36.06

相关文档