更新时间:2024-10-18 GMT+08:00
分享

CUDA和CUDNN

Vnt1机型软件版本建议:gpu driver version : 440.95.01

  • gpu driver version : 440.95.01(GPU驱动在宿主机中安装,镜像中无需安装)
  • cuda runtime version : 10.2(PyTorch自带,无需关心)
  • cudnn version : 7.6.x(PyTorch自带,无需关心)
  • pytorch version : 1.x.x+cu102

Vnt1机型软件版本建议:gpu driver version : 470.57.02

  • gpu driver version : 470.57.02(GPU驱动在宿主机中安装,镜像中无需安装)
  • cuda runtime version : 10.2(PyTorch自带,无需关心)
  • cudnn version : 7.6(PyTorch自带,无需关心)
  • pytorch version : 1.X.X-cu102

Vnt1机型软件版本建议:gpu driver version : 510.65.01

  • gpu driver version :510.65.01
  • cuda runtime version : 10.2(PyTorch自带,无需关心)
  • cudnn version : 7.6(PyTorch自带,无需关心)
  • pytorch version : 1.X.X-cu102

CUDA Compatibility如何使用?

当CUDA 10.2与低版本GPU驱动(440.33以下)配合使用时,可能会出现兼容问题,此时需要使用CUDA Compatibility。在创建训练页面添加以下环境变量:

export LD_LIBRARY_PATH=/usr/local/cuda/compat

训练时默认不需要加此环境变量,仅当发现驱动版本不够时才使用此方法。

专属池驱动版本如何升级?

当专属资源池中的节点含有GPU/Ascend资源时,用户基于自己的业务,可能会有自定义GPU/Ascend驱动的需求,ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力,具体操作请参见资源池驱动升级

相关文档