- 最新动态
- 功能总览
- 产品介绍
- 快速入门
- 用户指南
- 最佳实践
- API参考
- SDK参考
- 场景代码示例
-
常见问题
-
主机监控
- 如何配置DNS和安全组?
- 如何配置委托?
- CES Agent如何通过授权获取临时AK/SK?
- Agent支持的系统有哪些?
- Agent插件资源占用和熔断说明
- 主机监控Agent对主机的性能会有影响吗?
- Agent不同插件状态说明及处理方式
- Agent支持的指标列表
- 支持GPU监控的环境约束
- BMS硬件监控指标采集说明
- 什么是插件修复配置?
- 怎样让新购ECS实例中带有操作系统监控功能?
- Agent各种状态说明及异常状态处理方法
- 基础监控与操作系统监控数据出现不一致的问题
- 云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题
- 未安装UVP VMTools对弹性云服务器监控指标有什么影响?
- 为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标?
- 操作系统监控GPU页面显示无记录该如何处理?
- 执行命令安装Agent报错该如何处理?
- 为什么中文操作系统下安装了CES Agent后查看操作系统监控没有指标值?
- 如何通过修改配置文件开启/关闭指标采集?
- 如何通过修改配置文件调整Agent资源消耗阈值?
- 如何通过修改配置文件调整进程采集频率?
- 云服务监控
- 告警
- 站点监控
- 网络性能监控
-
主机监控
- 故障排除
- 视频帮助
- 文档下载
- 通用参考
链接复制成功!
概览
无论您使用的是ECS还是BMS,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。
主机监控分为基础监控、操作系统监控和进程监控。
- 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见云产品监控指标。BMS不支持基础监控,需要安装主机监控Agent插件。
- 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。数据采集频率为1分钟1次。除了CPU使用率等指标外,还可以支持内存使用率(Linux)等指标,详见云产品监控指标。
- 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。
- 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。
- ECS规格建议Linux使用“2vCPUs | 4GiB”、Windows使用“4vCPUs | 8GiB”或更高配置。
- Linux操作系统安装插件需要root权限;Windows操作系统安装插件需要管理员权限。
约束限制
主机监控仅针对于华为云公共镜像提供监控服务,如您是私有镜像,使用过程中出现任何问题,CES将不对此提供技术支持。
监控能力
云监控服务会提供CPU、内存、磁盘、网络等多种监控指标,满足服务器的基本监控运维需求。详细的监控指标请参考云产品监控指标。
性能说明
Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。
影响因素 |
场景说明 |
解决方式 |
---|---|---|
TCP连接数过多 |
Agent在默认情况下仅仅采集TCP TOTAL、TCP ESTABLISHED两个基础指标,此时比较节省CPU;当通过修改配置文件开启任何一个TCP详细指标时会采集全部TCP指标,此时比较消耗cpu。 TCP基础指标:TCP TOTAL、TCP ESTABLISHED。 TCP详细指标:TCP SYS_SENT、TCP SYS_RECV、TCP FIN_WAIT1、TCP FIN_WAIT2、TCP TIME_WAIT、TCP CLOSE、TCP CLOSE_WAIT、TCP LAST_ACK、 TCP LISTEN、 TCP CLOSING。 |
方式一:请参见修改配置文件开启/关闭指标采集,通过修改配置文件关闭TCP详细指标采集,节省CPU占用。 方式二:请参见修改配置文件调整Agent资源消耗阈值,调整Agent资源占用阈值。 |
文件句柄总数 |
Agent在运行过程中会遍历当前机器所有进程打开文件数并累计求和,采集文件句柄总数指标,当进程打开文件数过多时会导致Agent任务重进而导致CPU冲高。 |
方式一:请参见修改配置文件调整进程采集频率,通过修改配置文件降低Agent进程指标刷新频率,节省CPU占用。 方式二:请参见修改配置文件调整Agent资源消耗阈值,调整Agent资源占用阈值。 |
进程数量 |
Agent在运行过程中会遍历当前机器所有进程,通过查看进程的信息来采集进程级指标,当实例中进程数量过多时会导致Agent任务重进而导致CPU冲高。 |