CPH支持的事件监控
功能说明
事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。
命名空间
SYS.CPH
事件监控支持的事件列表
事件名称 |
事件ID |
事件级别 |
事件说明 |
处理建议 |
事件影响 |
---|---|---|---|---|---|
GPU故障 |
gpuAbnormal |
致命 |
GPU发生故障 |
GPU故障,支持故障类型如下:
|
业务中断 |
GPU恢复正常 |
gpuNormal |
提示 |
GPU从故障中恢复正常 |
无需处理 |
无 |
内核崩溃 |
gpuNormal |
致命 |
内核崩溃crash |
提交工单转运维处理 |
crash期间业务中断 |
内核OOM |
kernelOom |
重要 |
内核日志提示out of memory |
提交工单转运维处理 |
业务中断 |
硬件故障 |
hardwareError |
致命 |
内核日志报Hardware Error |
提交工单转运维处理 |
业务中断 |
PCIe故障 |
pcieAer |
致命 |
内核日志报PCIE Bus Error |
提交工单转运维处理 |
业务中断 |
SCSI故障 |
scsiError |
致命 |
内核日志报SCSI error |
提交工单转运维处理 |
业务中断 |
镜像存储只读故障 |
partReadOnly |
致命 |
镜像存储分区挂载属性变为readonly |
提交工单转运维处理 |
业务中断 |
镜像存储超级块损坏故障 |
badSuperBlock |
致命 |
镜像存储分区相关文件系统超级块损坏 |
提交工单转运维处理 |
业务中断 |
镜像存储sharedpath只读故障 |
isuladMasterReadOnly |
致命 |
镜像存储的/.sharedpath/master挂载属性只读 |
提交工单转运维处理 |
业务中断 |
云手机数据盘只读故障 |
cphDiskReadOnly |
致命 |
云手机数据盘挂载属性变为readonly |
提交工单转运维处理 |
业务中断 |
云手机数据盘超级块损坏故障 |
cphDiskReadOnly |
致命 |
云手机数据盘相关文件系统超级块损坏 |
提交工单转运维处理 |
业务中断 |