文档首页 > > 最佳实践> 监控> 裸金属服务器支持的监控指标

裸金属服务器支持的监控指标

分享
更新时间: 2019/05/07 GMT+08:00

裸金属服务器支持的监控指标有:CPU相关监控项(表1)、CPU负载类相关监控项(表2)、内存相关监控项(表3)、磁盘相关监控项(表4)、网卡类(表5)和软RAID相关监控项(表6)。

说明:

如果要监控软RAID相关指标,Agent版本必须为1.0.5及以上;其他监控项要求的Agent版本为1.0.4及以上。

表1 CPU相关监控指标说明

指标名称

指标含义

取值范围

测量对象

采集方式

空闲CPU使用率

该指标用于统计测量对象当前空闲CPU使用率,以百分比为单位。

0-1

裸金属服务器

通过计算10s间隔“/proc/stat”文件中的变化得出空闲CPU使用率。

用户可以通过top命令查看“%Cpu(s) id”值。

其他CPU使用率

该指标用于统计测量对象其他占用CPU使用率,以百分比为单位。

0-1

裸金属服务器

计算公式:

1 - 空闲CPU使用率(%) - 内核空间CPU使用率 - 用户空间CPU使用率

内核空间CPU使用率

该指标用于统计测量对象当前内核空间占用CPU使用率,以百分比为单位。

0-1

裸金属服务器

通过计算10s间隔“/proc/stat”文件中的变化得出内核空间CPU使用率。

用户可以通过top命令查看“%Cpu(s) sy”值。

用户空间CPU使用率

该指标用于统计测量对象当前用户空间占用CPU使用率,以百分比为单位。

0-1

裸金属服务器

通过计算10s间隔“/proc/stat”中的变化得出用户空间CPU使用率。

用户可以通过top命令查看“%Cpu(s) us”值。

表2 CPU负载指标说明

指标名称

指标含义

取值范围

测量对象

采集方式

1分钟内CPU负载

该指标用于统计在过去1分钟内测量对象的CPU负载情况,以Tasks/CPU为单位。

≥0

裸金属服务器

通过“/proc/loadavg”文件中load1/逻辑CPU个数得到。

用户可以通过top命令查看“load1”值。

5分钟内CPU负载

该指标用于统计在过去5分钟内测量对象的CPU负载情况,以Tasks/CPU为单位。

≥0

裸金属服务器

通过“/proc/loadavg”文件中load5/逻辑CPU个数得到。

用户可以通过top命令查看“load5”值。

15分钟内CPU负载

该指标用于统计在过去15分钟内测量对象的CPU负载情况,以Tasks/CPU为单位。

≥0

裸金属服务器

通过“/proc/loadavg”中load15/逻辑CPU个数得到。

用户可以通过top命令查看“load15”值。

表3 内存相关监控指标说明

指标名称

指标含义

取值范围

测量对象

采集方式

可用内存

该指标用于统计测量对象的可用内存,以GB为单位。

≥0 GB

裸金属服务器

通过“/proc/meminfo”文件得到MemAvailable;若“/proc/meminfo”中不显示MemAvailable,则MemAvailable=MemFree+Buffers+Cached

内存使用率

该指标用于统计测量对象的内存使用率,以百分比为单位。

0-1

裸金属服务器

通过“/proc/meminfo”文件获取,计算公式:(MemTotal-MemAvailable)/MemTotal

表4 磁盘相关监控指标说明

指标名称

指标含义

取值范围

测量对象

采集方式

磁盘剩余存储量

该指标用于统计测量对象磁盘的剩余存储空间,以GB为单位。

≥0 GB

裸金属服务器

执行df -h命令,查看Avail列数据。

磁盘存储总量

该指标用于统计测量对象磁盘存储总量,以GB为单位。

≥0 GB

裸金属服务器

执行df -h命令,查看Size列数据。

磁盘已用存量

该指标用于统计测量对象磁盘的已用存储空间,以GB为单位。

≥0 GB

裸金属服务器

执行df -h命令,查看Used列数据。

磁盘使用率

该指标用于统计测量对象磁盘使用率,以百分比为单位。计算方式为: 磁盘已用存储量/磁盘存储总量。

0-1

裸金属服务器

通过计算Used/Size得出。

磁盘读速率

该指标用于统计每秒从测量对象磁盘读出的数据量,以字节/秒为单位。

≥0 Byte/s

裸金属服务器

通过计算10s间隔“/proc/diskstats”文件中对应设备第六列数据的变化得出磁盘读速率。

磁盘读操作速率

该指标用于统计每秒从测量对象磁盘读取数据的请求次数,以请求/秒为单位。

≥0 Request/Second

裸金属服务器

通过计算10s间隔“/proc/diskstats”文件中对应设备第四列数据的变化得出磁盘读操作速率。

磁盘写速率

该指标用于统计每秒写到测量对象磁盘的数据量,以字节/秒为单位。

≥0 Byte/s

裸金属服务器

通过计算10s间隔“/proc/diskstats”文件中对应设备第十列数据的变化得出磁盘写速率。

磁盘写操作速率

该指标用于统计每秒向测量对象磁盘写数据的请求次数,以请求/秒为单位。

≥0 Request/Second

裸金属服务器

通过计算10s间隔“/proc/diskstats”文件中对应设备第八列数据的变化得出磁盘写操作速率。

表5 网卡相关监控指标说明

指标名称

指标含义

取值范围

测量对象

采集方式

下行带宽

该指标用于统计测量对象网卡每秒发送的比特数,以bit/s为单位。

≥0 bit/s

裸金属服务器

通过计算10s间隔“/proc/net/dev”文件中的变化得出。

上行带宽

该指标用于统计测量对象网卡每秒接收的比特数,以bit/s为单位。

≥0 bit/s

裸金属服务器

网卡包接收速率

该指标用于统计测量对象网卡每秒接收的数据包数,以Counts/s为单位。

≥0 Counts/s

裸金属服务器

网卡包发送速率

该指标用于统计测量对象网卡每秒发送的数据包数,以Counts/s为单位。

≥0 Counts/s

裸金属服务器

表6 软RAID相关监控指标说明

指标名称

指标含义

取值范围

测量对象

采集方式

软RAID活跃设备数

该指标用于统计测量对象软RAID设备的活跃盘数。

≥0,-1

裸金属服务器

通过10s间隔执行插件脚本“/usr/local/telescope/plugins/raid-monitor.sh”得出,脚本中计算“/proc/mdstat”文件中的变化并执行mdadm -D /dev/md0(RAID名称)得出。

软RAID工作设备数

该指标用于统计测量对象软RAID设备的工作设备数。

≥0,-1

裸金属服务器

软RAID失败设备数

该指标用于统计测量对象软RAID设备的失败设备数。

≥0,-1

裸金属服务器

软RAID备用设备数

该指标用于统计测量对象软RAID设备的备用设备数。

≥0,-1

裸金属服务器

软RAID状态

该指标用于统计测量对象软RAID设备的状态。

0, 1

裸金属服务器

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区