通过AOM监控主机
主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,否则AOM将无法监控)。同时,主机的IP地址支持IPv4。
通过主机监控功能您可以及时了解主机的资源使用情况、趋势和告警信息,使用这些信息,您可以快速响应和处理异常,保证主机流畅运行。
约束与限制
- 一个主机最多可添加5个标签,且标签键不能重复。
- 不同主机可添加同一个标签。
通过AOM监控主机
- 登录AOM 2.0控制台。
- 在左侧导航栏中选择“基础设施监控 > 主机监控”,查看通过NodeExporter采集的服务器列表和通过ICAgent采集的主机列表。
- 在“NodeExporter 采集”页签的服务器列表上方搜索框中设置服务器名称、运行状态、IP地址等过滤条件,实现主机列表过滤显示。
- 在“ICAgent 采集”页签的主机列表上方搜索框中设置主机名称、运行状态、IP地址等过滤条件,实现服务器列表过滤显示。
- 单击列表右上角
,在“设置”弹框中对列表进行自定义设置。
- 基础设置
- 表格内容折行:启用此能力可让表格内容自动折行,禁用此功能可截断文本。
- 表格数据列固定:启用此能力可让表格数据列固定可见。
- 自定义显示列:通过选中或取消选中“自定义显示列”前的复选框,自定义可选列的展示与隐藏。
- 基础设置
- 您可根据需要对“ICAgent 采集”页签主机执行如下操作:
- 通过开启或关闭右上角的“隐藏控制节点”开关,自定义控制节点的展示与隐藏。系统默认开启隐藏控制节点。
- 单击主机列表操作列的“同步主机信息”,可同步该主机信息;也可单击主机列表左上角的“同步主机信息”,同步所有主机信息。
- 当主机名称过于复杂不便于识别时,可根据需要给主机添加一个便于识别的别名。单击主机列表操作列的“增加别名”,输入别名,再单击“确定”,即可成功增加别名。
- 标签是主机的标识,通过标签您可以对主机进行管理。例如:添加标签后,您可快速识别、选择主机。单击主机列表操作列的“添加标签”,输入“标签键”和“标签值”后,单击
,再单击“确定”,即可成功添加标签。
添加的别名只允许单击主机列表操作列的“编辑标签”,进行修改,不允许删除。
- 在主机列表右上角设置主机信息的统计条件。
- 设置时间范围,查看已设时间范围内上报的主机,您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。
- 设置信息的刷新频率。单击右上角的
,根据需要从下拉列表中选择,例如,手动刷新、30秒、1分钟、5分钟。
- 设置搜索条件搜索待监控的主机。不支持通过别名搜索主机。
- 单击“NodeExporter 采集”页签的服务器名称或“ICAgent 采集”页签的主机名称,进入服务器或主机详情页面,在详情卡片区域,可查看该服务器或主机的运行状态、ID等信息。
表1 通过NodeExporter采集的服务器详情页 功能
功能说明
服务器信息
展示服务器的统计概括、基本信息、告警等信息。
监控视图
展示服务器的关键指标图表。
- 单击Prometheus实例下拉框,可以切换Prometheus实例,查看不同实例的监控视图。
- 单击
设置查询时间,最长监控时间为90天。包括:相对时间、整点时间、自定义。
- 相对时间:表示查询距离当前时间1分钟、5分钟、15分钟等时间区间的数据。例如当前时间为19:20:31,设置相对时间1小时,表示查询18:20:31~19:20:31的数据。
- 整点时间:表示查询最近整点1分钟、15分钟等时间区间的数据。例如当前时间为19:20:31,设置整点时间1小时,表示查询18:00:00~19:00:00的数据。
- 自定义:表示查询指定时间范围的数据。
- 单击
,全屏查看监控视图。将光标移至屏幕上方,单击弹出的
,或者单击
,或者按键盘中的“Esc”可退出全屏模式。 - 单击
可手动刷新当前页面。
进程
展示服务器进程的进程名称、CPU使用率和内存使用率。
文件系统
展示服务器文件系统的基本信息,单击磁盘文件分区名称,可在“监控视图”页面监控该文件系统的各种指标。
磁盘
展示服务器磁盘的基本信息,单击磁盘名称,可在“监控视图”页面监控该磁盘的各种指标。
网卡
展示服务器网卡的基本信息,单击网卡名称,可在“监控视图”页面监控该网卡的各种指标。
事件
展示服务器的事件详情,详情请参见查看AOM告警或事件。
告警
展示服务器的告警详情,详情请参见查看AOM告警或事件。
表2 通过ICAgent采集的主机详情 功能
功能说明
进程列表/Pod实例
- 在ECS主机的“进程列表”页签下,可查看该主机的进程状态、IP地址等信息。
- 在进程列表右上角的搜索框可按进程名称等设置搜索条件,实现进程过滤显示。
- 单击右上角的
,可获取到设置的时间范围内进程的最新信息。
- 在CCE主机的“Pod实例”页签下,可查看实例状态、节点IP等信息。
- 单击实例名称,可逐层下钻查看该实例的容器、进程的详细信息。
- 在实例列表右上角的搜索框可按实例名称等设置搜索条件,实现实例过滤显示。
- 单击右上角的
,可获取到设置的时间范围内实例的最新信息。
监控视图
展示该主机的关键指标图表。
- 单击Prometheus实例下拉框,可以切换Prometheus实例,查看不同实例的监控视图。
- 单击
设置查询时间,最长监控时间为90天。包括:相对时间、整点时间、自定义。
- 相对时间:表示查询距离当前时间1分钟、5分钟、15分钟等时间区间的数据。例如当前时间为19:20:31,设置相对时间1小时,表示查询18:20:31~19:20:31的数据。
- 整点时间:表示查询最近整点1分钟、15分钟等时间区间的数据。例如当前时间为19:20:31,设置整点时间1小时,表示查询18:00:00~19:00:00的数据。
- 自定义:表示查询指定时间范围的数据。
- 单击
,全屏查看监控视图。将光标移至屏幕上方,单击弹出的
,或者单击
,或者按键盘中的“Esc”可退出全屏模式。 - 单击
可手动刷新当前页面。
文件系统
展示该主机文件系统的基本信息,单击磁盘文件分区名称,可在“监控视图”页面监控该文件系统的各种指标。
磁盘
展示该主机磁盘的基本信息,单击磁盘名称,可在“监控视图”页面监控该磁盘的各种指标。
网卡
展示该主机网卡的基本信息,单击网卡名称,可在“监控视图”页面监控该网卡的各种指标。
显卡
展示该主机显卡的基本信息,单击显卡名称,可在“监控视图”页面监控该显卡的各种指标。
事件
展示该主机的事件详情,详情请参见查看AOM告警或事件。
告警
展示该主机的告警详情,详情请参见查看AOM告警或事件。