DCS支持事件监控的事件说明
功能说明
事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。
命名空间
SYS.DCS
事件监控支持的事件列表
事件名称 |
事件ID |
事件级别 |
事件说明 |
处理建议 |
事件影响 |
---|---|---|---|---|---|
在线迁移发生全量重试 |
migrationFullResync |
次要 |
在线迁移在重试时,因无法进行增量同步,而触发了全量同步。 |
确认是否发生反复的全量重试,需要检查到源端的网络连接是否正常,是否源端压力过大。如果反复全量重试,联系运维人员处理。 |
迁移任务与源实例发生中断,重新触发了全量同步,可能导致源实例CPU冲高。 |
实例主备切换(故障切换) |
masterStandbyFailover |
次要 |
Redis主节点异常,触发主从倒换机制,备节点升主。 |
检查业务是否自愈。如果应用未恢复,需要重启应用进行恢复。 |
实例长连接会中断。 |
Memcached主从倒换 |
memcachedMasterStandbyFailover |
次要 |
Memcached主节点异常,触发主从倒换机制,备节点升主。 |
检查业务是否自愈。如果应用未恢复,需要重启应用进行恢复。 |
实例长连接会中断。 |
Redis节点状态异常 |
redisNodeStatusAbnormal |
重要 |
Redis节点状态异常。 |
检查业务是否受影响 ,如果影响联系运维人员处理。 |
节点状态异常,主节点异常会自动主备切换。从节点异常,如果客户端直连从节点进行读写分离,读操作会出现异常。 |
Redis节点状态恢复正常 |
redisNodeStatusNormal |
重要 |
Redis节点从异常恢复正常。 |
检查业务是否恢复。如果应用未重连,需要重启应用进行恢复。 |
异常恢复事件。 |
数据迁移同步失败 |
migrateSyncDataFail |
重要 |
执行在线迁移任务时,迁移任务失败。 |
重新配置迁移任务重试迁移。如果仍然失败,联系运维人员处理。 |
数据迁移失败。 |
Memcached实例状态异常 |
memcachedInstanceStatusAbnormal |
重要 |
Memcached节点状态异常。 |
检查业务是否受影响 ,如果影响联系运维人员处理。 |
Memcached实例状态异常,实例可能无法访问。 |
Memcached实例状态异常恢复 |
memcachedInstanceStatusNormal |
重要 |
Memcached节点从异常恢复正常。 |
检查业务是否恢复。如果应用未重连,需要重启应用进行恢复。 |
异常恢复事件。 |
实例备份失败 |
instanceBackupFailure |
重要 |
DCS实例备份失败,一般可能是由于访问OBS失败等原因导致。 |
手动备份进行重试。 |
自动备份失败。 |
实例节点异常重启 |
instanceNodeAbnormalRestart |
重要 |
一般是由于DCS实例节点异常后重启导致。 |
检查业务是否自愈。如果应用未恢复,需要重启应用进行恢复。 |
实例长连接会中断。 |
终止超时lua脚本 |
scriptsStopped |
提醒 |
一般是由于lua脚本运行时间过长,自动终止脚本运行。 |
优化lua脚本,防止执行超时。 |
lua脚本执行时间超长,被强制中断。lua脚本执行时间过长,会阻塞整个实例。 |
节点自动重启 |
nodeRestarted |
提醒 |
一般是由于lua脚本运行时间过长,并且已执行写操作,自动重启节点终止脚本运行。 |
检查业务是否自愈。如果应用未恢复,需要重启应用进行恢复。 |
实例长连接会中断。 |
触发带宽弹性伸缩 |
bandwidthAutoScalingTriggered |
提示 |
实例带宽使用达到阈值,触发带宽弹性伸缩。 |
关注该实例业务情况。 |
实例带宽使用达到阈值,触发带宽弹性伸缩。带宽增加会新增计费。 |
触发规格弹性伸缩成功 |
specAutoScalingTriggeredSuccess |
提示 |
实例规格弹性伸缩成功。 |
关注该实例业务情况。 |
实例扩容成功,请关注实例信息。 |
触发规格弹性伸缩失败 |
specAutoScalingTriggeredFail |
紧急 |
实例规格弹性伸缩失败。 |
弹性伸缩失败,联系后台人员确认原因。 |
实例扩容失败,请登录控制台查看是否影响业务。 |