更新时间:2025-09-25 GMT+08:00
系统异常重启的原因排查
可能性 1: 内存耗尽 (OOM - Out Of Memory)
- 解决方案:
- 从业务进程排查,确认是否有内存泄漏,导致OOM。
- 如果确认业务需要比较多的内存,建议升级弹性云服务器内存规格。
可能性 2: Kernel Panic
- 排查方法:
- 日志确认: /var/log/messages中存在 "Kernel panic - not syncing", "Oops"等关键字。
- 检查自动重启配置:
cat /proc/sys/kernel/panic # 输出为 0: 发生 Panic 后挂起,等待人工处理。 # 输出为 N: 发生 Panic 后 N 秒自动重启。
- 解决方案:
- 驱动/内核回滚: 如果问题出现在近期更新后,将内核或相关驱动(如显卡、网卡驱动)回滚到之前的稳定版本。
- 捕获现场: 为下次故障能保留现场,可临时禁用自动重启:
echo 0 > /proc/sys/kernel/panic # 临时修改