更新时间:2024-04-18 GMT+08:00

T4 GPU设备显示异常

问题描述

使用NVIDIA Tesla T4 GPU的云服务器,例如Pi2或G6规格,执行nvidia-smi命令查看GPU使用情况时,显示如下:
No devices were found

原因分析

NVIDIA Tesla T4 GPU是NVIDIA的新版本,默认使用并开启GSP Firmware,导致GPU无法识别。

处理方法一

该处理方法在重启云服务器后失效。

  1. 执行以下命令,移除NVIDIA内核模块。

    rmmod nvidia_drm

    rmmod nvidia_modeset

    rmmod nvidia

  2. 执行以下命令,关闭GSP Firmware开关,并载入NVIDIA内核模块。

    modprobe nvidia NVreg_EnableGpuFirmware=0

    modprobe nvidia_drm

    modprobe nvidia_modeset

  3. 如果问题依然存在,请联系客服。

处理方法二

  1. 执行以下命令,打开文件/etc/modprobe.d/nvidia.conf。

    vim /etc/modprobe.d/nvidia.conf

    单击“i”进入编辑模式。

  2. 在文件中添加以下内容。
    options nvidia NVreg_EnableGpuFirmware=0

    编辑完成后,单击Esc键,并输入 :wq! 退出。

  3. 执行以下命令,重启云服务器。

    reboot

  4. 如果问题依然存在,请联系客服。