更新时间:2025-12-19 GMT+08:00
分享

通过AOM监控主机

主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,否则AOM将无法监控)。同时,主机的IP地址支持IPv4。

通过主机监控功能您可以及时了解主机的资源使用情况、趋势和告警信息,使用这些信息,您可以快速响应和处理异常,保证主机流畅运行。

约束与限制

  • 一个主机最多可添加5个标签,且标签键不能重复。
  • 不同主机可添加同一个标签。

通过AOM监控主机

  1. 登录AOM 2.0控制台
  1. 在左侧导航栏中选择“基础设施监控 > 主机监控”,查看通过NodeExporter采集的服务器列表和通过ICAgent采集的主机列表。

    • 在“NodeExporter 采集”页签的服务器列表上方搜索框中设置服务器名称、运行状态、IP地址等过滤条件,实现主机列表过滤显示。
    • 在“ICAgent 采集”页签的主机列表上方搜索框中设置主机名称、运行状态、IP地址等过滤条件,实现服务器列表过滤显示。
    • 单击列表右上角,在“设置”弹框中对列表进行自定义设置。
      • 基础设置
        • 表格内容折行:启用此能力可让表格内容自动折行,禁用此功能可截断文本。
        • 表格数据列固定:启用此能力可让表格数据列固定可见。
      • 自定义显示列:通过选中或取消选中“自定义显示列”前的复选框,自定义可选列的展示与隐藏。
    • 您可根据需要对“ICAgent 采集”页签主机执行如下操作:
      • 通过开启或关闭右上角的“隐藏控制节点”开关,自定义控制节点的展示与隐藏。系统默认开启隐藏控制节点。
      • 单击主机列表操作列的“同步主机信息”,可同步该主机信息;也可单击主机列表左上角的“同步主机信息”,同步所有主机信息。
      • 当主机名称过于复杂不便于识别时,可根据需要给主机添加一个便于识别的别名。单击主机列表操作列的“增加别名”,输入别名,再单击“确定”,即可成功增加别名。

        增加的别名只允许单击主机列表操作列的“修改别名”,进行修改,不允许删除。

      • 标签是主机的标识,通过标签您可以对主机进行管理。例如:添加标签后,您可快速识别、选择主机。单击主机列表操作列的“添加标签”,输入“标签键”和“标签值”后,单击,再单击“确定”,即可成功添加标签。

        添加的别名只允许单击主机列表操作列的“编辑标签”,进行修改,不允许删除。

      • 在主机列表右上角设置主机信息的统计条件。
        • 设置时间范围,查看已设时间范围内上报的主机,您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
        • 设置信息的刷新频率。单击右上角的,根据需要从下拉列表中选择,例如,手动刷新、30秒、1分钟、5分钟。

  2. 设置搜索条件搜索待监控的主机。不支持通过别名搜索主机。
  3. 单击“NodeExporter 采集”页签的服务器名称或“ICAgent 采集”页签的主机名称,进入服务器或主机详情页面,在详情卡片区域,可查看该服务器或主机的运行状态、ID等信息。

    表1 通过NodeExporter采集的服务器详情页

    功能

    功能说明

    服务器信息

    展示服务器的统计概括、基本信息、告警等信息。

    监控视图

    展示服务器的关键指标图表。

    • 单击Prometheus实例下拉框,可以切换Prometheus实例,查看不同实例的监控视图。
    • 单击设置查询时间,最长监控时间为90天。包括:相对时间、整点时间、自定义。
      • 相对时间:表示查询距离当前时间1分钟、5分钟、15分钟等时间区间的数据。例如当前时间为19:20:31,设置相对时间1小时,表示查询18:20:31~19:20:31的数据。
      • 整点时间:表示查询最近整点1分钟、15分钟等时间区间的数据。例如当前时间为19:20:31,设置整点时间1小时,表示查询18:00:00~19:00:00的数据。
      • 自定义:表示查询指定时间范围的数据。
    • 单击,全屏查看监控视图。将光标移至屏幕上方,单击弹出的,或者单击,或者按键盘中的“Esc”可退出全屏模式。
    • 单击可手动刷新当前页面。

    进程

    展示服务器进程的进程名称、CPU使用率和内存使用率。

    文件系统

    展示服务器文件系统的基本信息,单击磁盘文件分区名称,可在“监控视图”页面监控该文件系统的各种指标。

    磁盘

    展示服务器磁盘的基本信息,单击磁盘名称,可在“监控视图”页面监控该磁盘的各种指标。

    网卡

    展示服务器网卡的基本信息,单击网卡名称,可在“监控视图”页面监控该网卡的各种指标。

    事件

    展示服务器的事件详情,详情请参见查看AOM告警或事件

    告警

    展示服务器的告警详情,详情请参见查看AOM告警或事件

    表2 通过ICAgent采集的主机详情

    功能

    功能说明

    进程列表/Pod实例

    • 在ECS主机的“进程列表”页签下,可查看该主机的进程状态、IP地址等信息。
      • 在进程列表右上角的搜索框可按进程名称等设置搜索条件,实现进程过滤显示。
      • 单击右上角的,可获取到设置的时间范围内进程的最新信息。
    • 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。
      • 单击实例名称,可逐层下钻查看该实例的容器、进程的详细信息。
      • 在实例列表右上角的搜索框可按实例名称等设置搜索条件,实现实例过滤显示。
      • 单击右上角的,可获取到设置的时间范围内实例的最新信息。

    监控视图

    展示该主机的关键指标图表。

    • 单击Prometheus实例下拉框,可以切换Prometheus实例,查看不同实例的监控视图。
    • 单击设置查询时间,最长监控时间为90天。包括:相对时间、整点时间、自定义。
      • 相对时间:表示查询距离当前时间1分钟、5分钟、15分钟等时间区间的数据。例如当前时间为19:20:31,设置相对时间1小时,表示查询18:20:31~19:20:31的数据。
      • 整点时间:表示查询最近整点1分钟、15分钟等时间区间的数据。例如当前时间为19:20:31,设置整点时间1小时,表示查询18:00:00~19:00:00的数据。
      • 自定义:表示查询指定时间范围的数据。
    • 单击,全屏查看监控视图。将光标移至屏幕上方,单击弹出的,或者单击,或者按键盘中的“Esc”可退出全屏模式。
    • 单击可手动刷新当前页面。

    文件系统

    展示该主机文件系统的基本信息,单击磁盘文件分区名称,可在“监控视图”页面监控该文件系统的各种指标。

    磁盘

    展示该主机磁盘的基本信息,单击磁盘名称,可在“监控视图”页面监控该磁盘的各种指标。

    网卡

    展示该主机网卡的基本信息,单击网卡名称,可在“监控视图”页面监控该网卡的各种指标。

    显卡

    展示该主机显卡的基本信息,单击显卡名称,可在“监控视图”页面监控该显卡的各种指标。

    事件

    展示该主机的事件详情,详情请参见查看AOM告警或事件

    告警

    展示该主机的告警详情,详情请参见查看AOM告警或事件

相关文档