更新时间:2024-04-17 GMT+08:00

事件监控支持的事件说明

表1 弹性云服务器

事件来源

事件名称

事件ID

事件级别

事件说明

处理建议

事件影响

ECS

重启虚拟机

rebootServer

次要

云服务器重启。包括:

  • 在管理控制台进行重启操作。
  • 通过API接口下发重启指令。

确认操作是否为主动执行。

  • 业务应用做成高可用。
  • 云服务器开机后,确认业务是否自动恢复。

业务中断。

因硬件故障触发重启

startAutoRecovery

重要

弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,迁移过程中系统会自动重启云服务器。

等待恢复成功,观察业务是否受到影响。

业务存在中断的可能。

因硬件故障重启已完成

endAutoRecovery

重要

当自动迁移完成后,弹性云服务器已恢复正常。

当收到“恢复成功”时,云服务器已正常工作,可继续使用。

业务恢复正常。

自动恢复超时(后台处理中)

faultAutoRecovery

重要

迁移弹性云服务器至正常的物理机操作超时。

迁移业务至其他云服务器。

业务中断。

开机失败

faultPowerOn

重要

云服务器开机失败。

重试开机,若仍开机失败,联系运维人员处理。

云服务器无法开机。

GPU链路故障

GPULinkFault

紧急

云服务器所在的主机上GPU卡故障。包括:

  • GPU卡故障。
  • GPU卡故障恢复中。

业务应用做成高可用。

GPU卡故障恢复后,确认业务是否自动恢复。

业务中断。

FPGA链路故障

FPGALinkFault

紧急

云服务器所在的主机上FPGA卡故障。包括:

  • FPGA卡故障。
  • FPGA卡故障恢复中。

业务应用做成高可用。

FPGA卡故障恢复后,确认业务是否自动恢复。

业务中断。

运行状态异常

vmIsRunningImproperly

重要

弹性云服务器故障或网卡异常导致运行状态异常。

业务应用做成高可用。

云服务器恢复后,确认业务是否自动恢复。

业务中断。

运行状态异常已恢复

vmIsRunningImproperlyRecovery

重要

弹性云服务器运行状态恢复正常。

等待运行状态恢复正常,观察业务是否收到影响。

业务恢复正常。

主机进程异常导致虚拟机故障

VMFaultsByHostProcessExceptions

紧急

云服务器所在宿主机服务进程异常,导致云服务器故障。

联系运维人员处理

云服务器故障。

自动恢复:弹性云服务器所在的硬件出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,该过程会导致云服务器重启。

表2 云备份

事件来源

事件名称

事件ID

事件级别

事件说明

处理建议

事件影响

CBR

创建备份失败

backupFailed

紧急

创建备份失败

尝试手动创建备份或者联系技术支持

可能造成数据丢失

使用备份恢复资源失败

restorationFailed

紧急

使用备份恢复资源失败

尝试使用其他备份恢复或者联系技术支持

可能造成数据丢失

备份删除失败

backupDeleteFailed

紧急

备份删除失败

稍后重试删除或者联系技术支持

可能造成计费异常

存储库删除失败

vaultDeleteFailed

紧急

储存库删除失败

稍后重试或联系技术支持

可能造成计费异常

复制失败

replicationFailed

紧急

备份复制失败

稍后重试或联系技术支持

可能造成数据丢失

创建备份成功

backupSucceeded

重要

创建备份成功

使用备份恢复资源成功

restorationSucceeded

重要

使用备份恢复资源成功

观察数据是否已成功恢复。

备份删除成功

backupDeletionSucceeded

重要

备份删除成功

存储库删除成功

vaultDeletionSucceeded

重要

存储库删除成功

复制成功

replicationSucceeded

重要

备份复制成功

客户端离线

agentOffline

紧急

客户端离线

请确保客户端状态正常且能够正常连接。

可能造成备份任务失败。

客户端上线

agentOnline

重要

客户端上线

无。

无。