更新时间:2024-06-28 GMT+08:00

组件监控

组件即您部署的服务,包括容器和普通进程。

组件列表展示了每个组件的名称、运行状态、所属应用等信息。AOM支持从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对组件的立体监控。

组件监控

  1. 登录AOM 2.0控制台。
  2. 在左侧导航栏中选择“基础设施监控 > 进程监控”,在右侧区域选择“组件监控”页签,进入组件监控界面,查看组件列表。

    • 组件列表中对组件名称、所属应用、部署方式、应用发现规则、使用率、操作等参数进行展示。
    • 为了方便查看组件列表,可以在组件列表上方设置运行状态、所属应用、集群名称、部署方式、组件名称等过滤条件,实现组件列表过滤显示。
    • 通过开启或关闭“隐藏系统组件”开关,自定义系统组件的展示与隐藏。系统默认隐藏系统组件。
    • 在页面右上角单击,通过选中/取消选中各展示项后的复选框,自定义列表项的展示/隐藏。

  3. 在页面右上角单击,根据需要在下拉列表中设置组件信息的统计条件。

    1. 设置时间范围,查看已设时间范围内组件。可通过如下两种方式设置时间范围:

      方式一:使用AOM预定义好的时间标签,例如,近30分钟、近1小时等,可根据实际需要选择不同的时间粒度。

      方式二:通过设置开始时间和结束时间,自定义时间段,最长可设置为30天。

    2. 设置信息的刷新频率。单击,根据需要从下拉列表中选择,例如,手动刷新、1分钟等。

  4. 可根据需要选择是否在组件列表对组件执行如下操作:

    • 增加别名

      当组件名称比较复杂,不便于识别时,可为该组件增加一个便于识别的别名。

      在组件列表中,单击组件所在行“操作”列下的,输入别名,再单击“确定”,别名添加成功。添加的别名只允许修改,不允许删除。

    • 添加标签

      标签是组件的标识,通过标签您可区分系统组件和非系统组件。AOM默认为系统组件(系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gpu-device-plugin、kube-dns、org.tanukisoftware.wrapper.WrapperSimpleApp、evs-driver、obs-driver、sfs-driver、icwatchdog、sh等)打上“System Service”标签。

      在组件列表中,单击组件所在行“操作”列下的 ,输入“标签键”和“标签值”后,单击,选中“标记为系统组件”复选框,可将其标记为系统组件,再单击“确定”,标签添加成功。

      • 每个组件总共可以创建五个标签。
      • 标签键值长度不超过36个字符,标签值长度不超过43个字符。
      • 标签的值只能包含大写字母、小写字母、数字和特殊符号(-_)。

  5. 设置搜索条件搜索要查看的组件。

    不支持通过别名搜索组件。

  6. 单击组件名称,进入“组件详情”页面。

    • 在“实例列表”页签,可查看该组件所有实例的概况。

      单击实例名称,可查看进程的监控视图与告警信息。

    • 在“主机列表”页签,可查看该组件所在的主机概况。
    • 在“监控视图”页签下,选择对应的Prometheus实例,可查看该组件的资源使用情况。单击页面右上角的,可全屏展示资源信息。
    • 在“告警”页签下,可查看该组件的告警详情,详情请参见查看告警
    • 在“事件”页签下,可查看该组件的事件详情,详情请参见查看事件