更新时间:2024-08-15 GMT+08:00
GPU实例故障处理流程
GPU实例故障处理流程如图1所示,对应的操作方法如下:
- CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。
- 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。
- GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。
- 非硬件故障自恢复处理方法:这类问题可以根据指导自行排查恢复。
- 显卡故障诊断及处理方法:这类问题可以根据指导确认后联系技术支持。
- 联系技术支持人员:无法自恢复请提交工单联系技术支持人员获取帮助。
父主题: GPU实例故障自诊断