选择GPU节点驱动版本
使用GPU加速型云服务器时,需要安装正确的Nvidia基础设施软件,才可以使用GPU实现计算加速功能。在使用GPU前,您需要根据GPU型号,选择兼容配套软件包并安装。
本文将介绍如何选择GPU节点的驱动版本及配套的CUDA Toolkit。
如何选择GPU节点驱动版本
一般情况下,使用GPU资源时您将会使用以下软件包,并且软件包版本需要保持配套:
- 驱动GPU工作的硬件驱动程序,如Tesla系列驱动。
- 上层应用程序所需要的库,如CUDA Toolkit工具包。
在容器使用场景下,GPU驱动是安装在节点上的,而CUDA Toolkit一般会在应用程序的容器镜像构建时预安装,或者可直接使用Nvidia官方已预装CUDA Toolkit的基础镜像构建应用容器镜像。GPU驱动和CUDA Toolkit版本需要配套才可以正常使用GPU资源。
您可以使用nvidia-smi命令查看的节点上驱动信息,确定Nvidia驱动与CUDA Toolkit版本的配套关系,如下图,驱动版本为470.141.03, 对应支持的CUDA Toolkit最大版本为11.4。
CUDA Toolkit和驱动的版本兼容性列表
在选择Nvidia驱动时,需要保证驱动版本兼容CUDA Toolkit版本,官方提供配套关系如下表。该表展示了CUDA Toolkit版本兼容的最低驱动版本,如需更精确的版本对照表,请参见CUDA Toolkit和驱动的版本兼容性列表。您可以根据应用所使用的CUDA Toolkit版本,选择合适的NVIDIA驱动版本。
在选择Nvidia驱动时,建议您在满足下表中CUDA版本和驱动版本配套关系的前提下,优先选择CCE推荐的GPU驱动版本列表中提供的GPU驱动版本。若CCE推荐的驱动版本无法匹配您使用的CUDA Toolkit版本,必须使用非推荐的驱动版本,则需要您自行验证机型、系统及驱动版本间的配套兼容性。
CUDA Toolit版本 |
兼容性所需的最低驱动版本(Linux x86_64) |
---|---|
CUDA 12.x |
>=525.60.13 |
CUDA 11.8.x CUDA 11.7.x CUDA 11.6.x CUDA 11.5.x CUDA 11.4.x CUDA 11.3.x CUDA 11.2.x CUDA 11.1.x |
>=450.80.02 |
CUDA 11.0 |
>=450.36.06 |