资源运行异常怎么办?
资源状态包括正常、亚健康、异常和通道静默。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。
亚健康
当有级别为次要或提示的告警时资源状态为亚健康。
修复建议:请在告警界面参考告警详细信息处理告警。
异常
当有级别为紧急或重要的告警时资源状态为异常。
修复建议:请在告警界面参考告警详细信息处理告警。
通道静默
当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下原因导致:
- 可能原因一:ICAgent问题
修复建议:在左侧导航栏中选择“配置管理 > Agent管理”,在列表的“ICAgent状态”列查看ICAgent状态,若状态不为“运行”,则说明ICAgent未安装或运行异常,可参考表1进行处理。
表1 ICAgent修复建议 状态
修复建议
未安装
主机未安装ICAgent,请安装ICAgent,操作详见安装ICAgent。
安装中
正在为主机安装ICAgent,安装ICAgent预计需要1分钟左右,请耐心等待。
安装失败
主机ICAgent安装失败,请登录服务器卸载后重新安装。
升级中
正在为主机升级ICAgent,升级ICAgent预计需要1分钟左右,请耐心等待。
升级失败
主机ICAgent升级失败,请登录服务器卸载后重新安装。
离线
AK/SK配置不正确或30200、30201端口未连通,处理操作详见如何处理界面“ICAgent状态”为“离线”的问题。
异常
主机ICAgent功能异常,请联系技术人员处理。
- 可能原因二:AOM不支持监控当前资源类型
修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。
- 可能原因三:资源被删除或被停止
修复建议:
- 在ECS界面检查主机是否已被重启、关机或删除。
- 在CCE界面检查服务是否已被停止或删除。
- 通过应用发现功能发现的应用,当应用规则被停止或删除时,应用也会同时被停止或删除,请在AOM的应用发现界面检查应用发现规则是否已被停止或删除。