事件监控支持的事件说明
事件来源 |
事件名称 |
事件ID |
事件级别 |
事件说明 |
处理建议 |
事件影响 |
---|---|---|---|---|---|---|
ECS |
重启虚拟机 |
rebootServer |
次要 |
云服务器重启。包括:
|
确认操作是否为主动执行。
|
业务中断。 |
因硬件故障触发重启 |
startAutoRecovery |
重要 |
弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,迁移过程中系统会自动重启云服务器。 |
等待恢复成功,观察业务是否受到影响。 |
业务存在中断的可能。 |
|
因硬件故障重启已完成 |
endAutoRecovery |
重要 |
当自动迁移完成后,弹性云服务器已恢复正常。 |
当收到“恢复成功”时,云服务器已正常工作,可继续使用。 |
业务恢复正常。 |
|
自动恢复超时(后台处理中) |
faultAutoRecovery |
重要 |
迁移弹性云服务器至正常的物理机操作超时。 |
迁移业务至其他云服务器。 |
业务中断。 |
|
开机失败 |
faultPowerOn |
重要 |
云服务器开机失败。 |
重试开机,若仍开机失败,联系运维人员处理。 |
云服务器无法开机。 |
|
GPU链路故障 |
GPULinkFault |
紧急 |
云服务器所在的主机上GPU卡故障。包括:
|
业务应用做成高可用。 GPU卡故障恢复后,确认业务是否自动恢复。 |
业务中断。 |
|
FPGA链路故障 |
FPGALinkFault |
紧急 |
云服务器所在的主机上FPGA卡故障。包括:
|
业务应用做成高可用。 FPGA卡故障恢复后,确认业务是否自动恢复。 |
业务中断。 |
|
运行状态异常 |
vmIsRunningImproperly |
重要 |
弹性云服务器故障或网卡异常导致运行状态异常。 |
业务应用做成高可用。 云服务器恢复后,确认业务是否自动恢复。 |
业务中断。 |
|
运行状态异常已恢复 |
vmIsRunningImproperlyRecovery |
重要 |
弹性云服务器运行状态恢复正常。 |
等待运行状态恢复正常,观察业务是否收到影响。 |
业务恢复正常。 |
|
主机进程异常导致虚拟机故障 |
VMFaultsByHostProcessExceptions |
紧急 |
云服务器所在宿主机服务进程异常,导致云服务器故障。 |
联系运维人员处理 |
云服务器故障。 |
自动恢复:弹性云服务器所在的硬件出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,该过程会导致云服务器重启。
事件来源 |
事件名称 |
事件ID |
事件级别 |
事件说明 |
处理建议 |
事件影响 |
---|---|---|---|---|---|---|
CBR |
创建备份失败 |
backupFailed |
紧急 |
创建备份失败 |
尝试手动创建备份或者联系技术支持 |
可能造成数据丢失 |
使用备份恢复资源失败 |
restorationFailed |
紧急 |
使用备份恢复资源失败 |
尝试使用其他备份恢复或者联系技术支持 |
可能造成数据丢失 |
|
备份删除失败 |
backupDeleteFailed |
紧急 |
备份删除失败 |
稍后重试删除或者联系技术支持 |
可能造成计费异常 |
|
存储库删除失败 |
vaultDeleteFailed |
紧急 |
储存库删除失败 |
稍后重试或联系技术支持 |
可能造成计费异常 |
|
复制失败 |
replicationFailed |
紧急 |
备份复制失败 |
稍后重试或联系技术支持 |
可能造成数据丢失 |
|
创建备份成功 |
backupSucceeded |
重要 |
创建备份成功 |
无 |
无 |
|
使用备份恢复资源成功 |
restorationSucceeded |
重要 |
使用备份恢复资源成功 |
观察数据是否已成功恢复。 |
无 |
|
备份删除成功 |
backupDeletionSucceeded |
重要 |
备份删除成功 |
无 |
无 |
|
存储库删除成功 |
vaultDeletionSucceeded |
重要 |
存储库删除成功 |
无 |
无 |
|
复制成功 |
replicationSucceeded |
重要 |
备份复制成功 |
无 |
无 |
|
客户端离线 |
agentOffline |
紧急 |
客户端离线 |
请确保客户端状态正常且能够正常连接。 |
可能造成备份任务失败。 |
|
客户端上线 |
agentOnline |
重要 |
客户端上线 |
无。 |
无。 |