文档首页/ 弹性云服务器 ECS/ 故障排除/ GPU驱动故障/ GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办?
更新时间:2023-05-31 GMT+08:00
分享

GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办?

问题描述

GPU实例启动异常,检查系统日志,发现NVIDIA驱动空指针访问。如图1所示。

图1 NVIDIA驱动空指针访问

可能原因

GPU驱动异常。

处理方法

  1. 卸载驱动。
    • 方法1:执行nvidia-uninstall命令,卸载驱动。

      如果提示命令不存在可以执行 查询云服务器安装的驱动版本:whereis n...卸载驱动。

    • 方法2:查询云服务器安装的驱动版本:whereis nvidia
      图2 查询安装的驱动版本

      根据查询的驱动版本从NVIDIA官网下载驱动包(此处重新下载驱动包是为了执行卸载动作,且后续重新安装驱动时需要此安装包)。

      以驱动版本nvidia-396.44为例,执行sh NVIDIA-Linux-x86_64-396.44.run --uninstall,卸载驱动

  2. 重装驱动。

    操作指导请参考:安装GPU驱动

相关文档