文档首页/ 弹性云服务器 ECS/ 故障排除/ GPU实例故障自诊断/ 显卡故障诊断及处理方法/ 如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'”
更新时间:2024-08-15 GMT+08:00

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'”

问题原因

  1. 总线脱落。

  2. 内核版本不一致。

问题影响

显卡驱动安装失败,显卡无法使用。

处理方法

  1. 执行以下命令,查看内核版本,检查内核版本是否一致。

    rpm -qa | grep gcc #查看gcc版本

    rpm -qa | grep kernel-devel #查看kernel-devel版本

    • 如果内核版本不一致,请重装驱动。
    • 如果内核版本一致,则执行下一步。
  2. 查看dmesg日志,检查是否存在NVRM报错。
    • 如果报错“NVRM: fallen off the bus and is not responding to commands”,说明是总线脱落,请联系技术支持人员换卡。
    • 如果仍未确认问题,请根据故障信息收集收集GPU故障后联系技术支持处理。