资源运行异常怎么办?
资源状态包括正常、亚健康、异常、通道静默和已删除。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。
亚健康
当有级别为次要或提示的告警时资源状态为亚健康。
修复建议:请在告警界面参考告警详细信息处理告警。
异常
当有级别为紧急或重要的告警时资源状态为异常。
修复建议:请在告警界面参考告警详细信息处理告警。
通道静默
当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下4个原因导致。
- 可能原因一:ICAgent问题
修复建议:在左侧导航栏中选择“配置管理 > Agent管理”,在列表的“ICAgent状态”列查看ICAgent状态,若状态不为“运行”,则说明ICAgent未安装或运行异常,可参考表1进行处理。
表1 ICAgent修复建议 状态
修复建议
未安装
主机未安装ICAgent。安装ICAgent,详细操作请参见安装ICAgent。
安装中
正在为主机安装ICAgent。安装ICAgent预计需要1分钟左右,请耐心等待。
安装失败
主机ICAgent安装失败,请登录服务器卸载后重新安装。
升级中
正在升级主机ICAgent。升级ICAgent预计需要1分钟左右,请耐心等待。
升级失败
主机ICAgent升级失败。请登录服务器卸载后重新安装。
离线
输入的AK/SK错误或ECS委托设置错误导致主机ICAgent功能异常。请获取正确的AK/SK或正确设置ECS委托。
异常
主机ICAgent功能异常。请联系技术工程师处理。
- 可能原因二:AOM不支持监控当前资源类型
修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。
- 可能原因三:主机本地时间与NTP服务器时间不同步
NTP同步状态(ntpStatus):该指标用于统计主机本地时间与NTP服务器时间是否同步。可取值为0或1,0表示同步,1表示未同步。
修复建议:在“监控 > 指标浏览”界面查看主机的NTP同步状态指标,如果NTP同步状态指标对应的值为1,则说明主机NTP时间与NTP服务器时间不同步,请您对主机NTP时间与NTP服务器时间进行同步。
- 可能原因四:资源被删除或被停止
修复建议:
- 在ECS界面检查主机是否已被重启、关机或删除。
- 在CCE界面检查组件是否已被停止或删除。
- 通过发现功能发现上来的组件,当发现规则被停止或删除时组件也会同时被停止或删除,请在AOM的发现界面查看发现规则。