更新时间:2022-06-01 GMT+08:00

资源运行异常怎么办?

资源状态包括正常、亚健康、异常、通道静默和已删除。亚健康、异常或通道静默都可能导致资源运行异常,您可参考如下指导进行分析和修复。

亚健康

当有级别为次要或提示的告警时资源状态为亚健康。

修复建议:请在告警界面参考告警详细信息处理告警。

异常

当有级别为紧急或重要的告警时资源状态为异常。

修复建议:请在告警界面参考告警详细信息处理告警。

通道静默

当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下4个原因导致。

  • 可能原因一:ICAgent问题

    修复建议:在左侧导航栏中选择“配置管理 > Agent管理”,在列表的“ICAgent状态”列查看ICAgent状态,若状态不为“运行”,则说明ICAgent未安装或运行异常,可参考表1进行处理。

    表1 ICAgent修复建议

    状态

    修复建议

    未安装

    主机未安装ICAgent。安装ICAgent,详细操作请参见安装ICAgent

    安装中

    正在为主机安装ICAgent。安装ICAgent预计需要1分钟左右,请耐心等待。

    安装失败

    主机ICAgent安装失败,请登录服务器卸载后重新安装。

    升级中

    正在升级主机ICAgent。升级ICAgent预计需要1分钟左右,请耐心等待。

    升级失败

    主机ICAgent升级失败。请登录服务器卸载后重新安装。

    离线

    输入的AK/SK错误或ECS委托设置错误导致主机ICAgent功能异常。请获取正确的AK/SK或正确设置ECS委托。

    异常

    主机ICAgent功能异常。请联系技术工程师处理。

  • 可能原因二:AOM不支持监控当前资源类型

    修复建议:请检查您的资源是否为AOM监控的类型,AOM当前支持监控的资源类型有:主机、K8s容器、用户进程(AOM不监控主机的系统进程)。

  • 可能原因三:主机本地时间与NTP服务器时间不同步

    NTP同步状态(ntpStatus):该指标用于统计主机本地时间与NTP服务器时间是否同步。可取值为0或1,0表示同步,1表示未同步。

    修复建议:在“监控 > 指标浏览”界面查看主机的NTP同步状态指标,如果NTP同步状态指标对应的值为1,则说明主机NTP时间与NTP服务器时间不同步,请您对主机NTP时间与NTP服务器时间进行同步。

  • 可能原因四:资源被删除或被停止

    修复建议:

    • 在ECS界面检查主机是否已被重启、关机或删除。
    • 在CCE界面检查组件是否已被停止或删除。
    • 通过发现功能发现上来的组件,当发现规则被停止或删除时组件也会同时被停止或删除,请在AOM的发现界面查看发现规则。