事件监控支持的事件说明
事件来源 |
事件名称 |
事件ID |
事件级别 |
事件说明 |
处理建议 |
事件影响 |
---|---|---|---|---|---|---|
ECS |
开始恢复 |
startAutoRecovery |
重要 |
弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,迁移过程中系统会自动重启云服务器。 |
等待恢复成功,观察业务是否受到影响。 |
业务存在中断的可能。 |
恢复成功 |
endAutoRecovery |
重要 |
当自动迁移完成后,弹性云服务器已恢复正常。 |
当收到“恢复成功”时,云服务器已正常工作,可继续使用。 |
业务恢复正常。 |
|
自动恢复超时(后台处理中) |
faultAutoRecovery |
重要 |
迁移弹性云服务器至正常的物理机操作超时。 |
迁移业务至其他云服务器。 |
业务中断。 |
|
GPU链路故障 |
GPULinkFault |
紧急 |
弹性云服务器所在的主机上GPU卡故障。包括:
|
业务应用做成高可用。 GPU卡故障恢复后,确认业务是否自动恢复。 |
业务中断。 |
|
FPGA链路故障 |
FPGALinkFault |
紧急 |
弹性云服务器所在的主机上FPGA卡故障。包括:
|
业务应用做成高可用。 FPGA卡故障恢复后,确认业务是否自动恢复。 |
业务中断。 |
|
删除虚拟机 |
deleteServer |
重要 |
删除云服务器。包括:
|
确认删除操作是否为主动执行。 |
业务中断。 |
|
重启虚拟机 |
rebootServer |
次要 |
云服务器重启。包括:
|
确认操作是否为主动执行。
|
业务中断。 |
|
关闭虚拟机 |
stopServer |
次要 |
云服务器关机。包括:
说明:
“关闭虚拟机”事件需要开启云审计后才生效,详细请参见《云审计服务用户指南》。 |
|
业务中断。 |
|
删除网卡 |
deleteNic |
重要 |
云服务器删除网卡。包括:
|
|
网卡被删除,存在业务中断的可能。 |
|
变更规格 |
resizeServer |
次要 |
云服务器规格变更。包括:
|
|
业务中断。 |
|
GuestOS系统层重启告警 |
RestartGuestOS |
一般 |
GuestOS内部重启。 |
联系运维人员处理。 |
在系统重启场景下,可能导致业务中断。 |
|
主机进程异常导致虚拟机故障 |
VMFaultsByHostProcessExceptions |
紧急 |
云服务器所在宿主机服务进程异常,导致云服务器故障。 |
联系运维人员处理 |
云服务器故障。 |
|
开机失败 |
faultPowerOn |
重要 |
云服务器开机失败。 |
重试开机,若仍开机失败,联系运维人员处理。 |
云服务器无法开机。 |
|
宿主机存在宕机风险 |
hostMayCrash |
重要 |
弹性云服务器所在的宿主机存在宕机风险,且由于一些原因,无法通过热迁移手段规避该风险。 |
将该弹性云服务器上业务移除,并将该弹性云服务器删除或关机,等待运维人员处理完风险后再开机。 |
可能因为宿主机宕机而导致业务中断。 |
自动恢复:弹性云服务器所在的硬件出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,该过程会导致云服务器重启。
事件来源 |
事件名称 |
事件ID |
事件级别 |
---|---|---|---|
EIP |
释放EIP |
deleteEip |
次要 |
事件来源 |
事件名称 |
事件ID |
事件级别 |
---|---|---|---|
VPC |
删除VPC |
deleteVpc |
重要 |
修改VPC |
modifyVpc |
次要 |
|
删除Subnet |
deleteSubnet |
次要 |
|
修改Subnet |
modifySubnet |
次要 |
|
修改带宽 |
modifyBandwidth |
次要 |
|
删除VPN |
deleteVpn |
重要 |
|
修改VPN |
modifyVpn |
次要 |
事件来源 |
事件名称 |
事件ID |
事件级别 |
事件说明 |
处理建议 |
事件影响 |
---|---|---|---|---|---|---|
EVS |
更新磁盘 |
updateVolume |
次要 |
更新一个云硬盘的名称和描述。 |
无需处理。 |
无。 |
扩容磁盘 |
extendVolume |
次要 |
对按需或者包周期云硬盘进行扩容。 |
无需处理。 |
无。 |
|
删除磁盘 |
deleteVolume |
重要 |
删除一个云硬盘。 |
无需处理。 |
删除的磁盘将不能被恢复。 |
|
磁盘性能达到QoS上限 |
reachQoS |
重要 |
磁盘性能频繁达到该规格的QoS上限,从而触发流控,导致IO访问时延变大。 |
磁盘性能频繁达到该规格的QoS上限,从而触发流控,导致IO访问时延变大,意味该类型的磁盘可能无法满足当前业务需求,建议提升磁盘规格。 |
磁盘性能频繁达到该规格的QoS上限,从而触发流控,导致IO访问时延变大,意味该类型的磁盘可能无法满足当前业务需求,建议提升磁盘规格 |
|
存储池故障 |
storagePoolFault |
紧急 |
当存储池中有数据不可访问时,系统会产生此告警。 |
请联系EVS相关人员进行处理。对于依赖EVS的服务及资源,请判断是否需要做切换。 |
存储池故障可能导致磁盘无法正常读写,建议使用者在读写受影响时,及时进行灾备。 |
事件来源 |
事件名称 |
事件ID |
事件级别 |
---|---|---|---|
IAM |
用户登录 |
login |
次要 |
用户登出 |
logout |
次要 |
|
登录重置密码 |
changePassword |
重要 |
|
创建用户 |
createUser |
次要 |
|
删除用户 |
deleteUser |
重要 |
|
修改用户 |
updateUser |
次要 |
|
创建用户组 |
createUserGroup |
次要 |
|
删除用户组 |
deleteUserGroup |
重要 |
|
修改用户组 |
updateUserGroup |
次要 |
|
创建idp |
createIdentityProvider |
次要 |
|
删除idp |
deleteIdentityProvider |
重要 |
|
修改idp |
updateIdentityProvider |
次要 |
|
更新metadata |
updateMetadata |
次要 |
|
更新帐号登录策略 |
updateSecurityPolicies |
重要 |
|
创建AK/SK |
addCredential |
重要 |
|
删除AK/SK |
deleteCredential |
重要 |
|
创建project |
createProject |
次要 |
|
更新project |
updateProject |
次要 |
|
冻结项目 |
suspendProject |
重要 |
事件来源 |
事件名称 |
事件ID |
事件级别 |
---|---|---|---|
KMS |
禁用密钥 |
disableKey |
重要 |
计划删除密钥 |
scheduleKeyDeletion |
次要 |
|
退役授权 |
retireGrant |
重要 |
|
撤销授权 |
revokeGrant |
重要 |
事件来源 |
事件名称 |
事件ID |
事件级别 |
---|---|---|---|
OBS |
删除桶 |
deleteBucket |
重要 |
删除桶policy配置 |
deleteBucketPolicy |
重要 |
|
设置桶的ACL |
setBucketAcl |
次要 |
|
设置桶的策略 |
setBucketPolicy |
次要 |