弹性云服务器 ECS弹性云服务器 ECS

计算
弹性云服务器 ECS
云耀云服务器 HECS
裸金属服务器 BMS
弹性伸缩 AS
镜像服务 IMS
专属主机 DeH
函数工作流 FunctionGraph
云手机 CPH
VR云渲游平台 CVR
特惠算力专区
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
内容分发网络 CDN
存储容灾服务 SDRS
弹性文件服务 SFS
云服务器备份 CSBS
云硬盘备份 VBS
数据快递服务 DES
专属企业存储服务
智能边缘
智能边缘云 IEC
EI 企业智能
EI安视服务
AI开发平台ModelArts
数据湖治理中心 DGC
数据仓库服务 GaussDB(DWS)
企业级AI应用开发专业套件 ModelArts Pro
数据湖探索 DLI
华为HiLens
云搜索服务 CSS
数据接入服务 DIS
表格存储服务 CloudTable
数据湖工厂 DLF
图引擎服务 GES
推荐系统 RES
文字识别 OCR
内容审核 Moderation
图像识别 Image
图像搜索 ImageSearch
人脸识别服务 FRS
对话机器人服务 CBS
视频分析服务 VAS
数据可视化 DLV
视频接入服务 VIS
自然语言处理 NLP
语音交互服务 SIS
知识图谱 KG
医疗智能体 EIHealth
可信智能计算服务 TICS
园区智能体 CampusGo
实时流计算服务 CS
人证核身服务 IVS
IoT物联网
设备接入 IoTDA
IoT物联网
全球SIM联接 GSL
设备发放 IoTDP
IoT开发者服务
IoT边缘 IoTEdge
IoT数据分析
路网数字化服务 DRIS
开发与运维
项目管理 ProjectMan
代码托管 CodeHub
流水线 CloudPipeline
代码检查 CodeCheck
编译构建 CloudBuild
部署 CloudDeploy
云测 CloudTest
发布 CloudRelease
移动应用测试 MobileAPPTest
CloudIDE
Classroom
软件开发平台 DevCloud
开源镜像站 Mirrors
视频
媒体处理 MPC
视频点播 VOD
视频直播 Live
实时音视频 SparkRTC
管理与部署
统一身份认证服务 IAM
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云审计服务 CTS
云日志服务 LTS
标签管理服务 TMS
资源管理服务 RMS
应用身份管理服务 OneAccess
专属云
专属计算集群 DCC
专属分布式存储服务 DSS
域名与网站
域名注册服务 Domains
云速建站 CloudSite
企业协同
华为云WeLink
会议
ISDP
解决方案
全栈专属服务
高性能计算 HPC
SAP
游戏云
混合云灾备
快视频
华为工业云平台 IMC
价格
价格原则
成本优化最佳实践
昇腾
昇腾MindX SDK (20.3)
其他
管理控制台
消息中心
产品价格详情
系统权限
我的凭证
客户关联华为云合作伙伴须知
公共问题
宽限期保留期
奖励推广计划
活动
容器
云容器引擎 CCE
云容器实例 CCI
容器镜像服务 SWR
应用编排服务 AOS
容器交付流水线 ContainerOps
应用服务网格 ASM
多云容器平台 MCP
基因容器 GCS
容器洞察引擎 CIE
容器批量计算 BCE
云原生服务中心 OSC
网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
数据库
云数据库 RDS
文档数据库服务 DDS
分布式数据库中间件 DDM
数据复制服务 DRS
数据管理服务 DAS
云数据库 GaussDB(for MySQL)
云数据库 GaussDB NoSQL
云数据库 GaussDB (for openGauss)
数据库和应用迁移 UGO
大数据
MapReduce服务 MRS
应用中间件
应用管理与运维平台 ServiceStage
分布式缓存服务 DCS
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
消息通知服务 SMN
微服务引擎 CSE
云性能测试服务 CPTS
区块链服务 BCS
API网关 APIG
应用魔方 AppCube
分布式消息服务RocketMQ版
多云高可用服务 MAS
可信跨链数据链接服务 TCDAS
企业应用
云桌面 Workspace
云解析服务 DNS
应用与数据集成平台 ROMA Connect
ROMA资产中心 ROMAExchange
ROMA API
鸿源云道
华为乾坤
安全与合规
Web应用防火墙 WAF
漏洞扫描服务 VSS
企业主机安全 HSS
容器安全服务 CGS
数据加密服务 DEW
数据库安全服务 DBSS
态势感知 SA
云堡垒机 CBH
SSL证书管理 SCM
云证书管理服务 CCM
管理检测与响应 MDR
数据安全中心 DSC
威胁检测服务 MTD
DDoS防护 ADS
云防火墙 CFW
应用信任中心 ATC
安全技术与应用
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
智能协作
IdeaHub
企业网络
云管理网络
SD-WAN 云服务
边缘数据中心管理 EDCM
废弃-华为乾坤安全云服务
云通信
语音通话 VoiceCall
消息&短信 MSGSMS
隐私保护通话 PrivateNumber
开发者工具
SDK开发指南
API签名指南
DevStar
HCloud CLI
Terraform
Ansible
云生态
云市场
鲲鹏
昇腾
合作伙伴中心
华为云培训中心
用户服务
帐号中心
费用中心
成本中心
资源中心
企业管理
工单管理
客户运营能力
国际站常见问题
网站备案
支持计划
专业服务
合作伙伴支持计划
文档首页> 弹性云服务器 ECS> 用户指南> 监控> 弹性云服务器支持的操作系统监控指标(安装Agent)
更新时间:2021/03/18 GMT+08:00
分享

弹性云服务器支持的操作系统监控指标(安装Agent)

功能说明

操作系统监控目前支持监控的监控指标有:CPU相关监控项、CPU负载类相关监控项、内存相关监控项、磁盘相关监控项、磁盘I/O相关监控项、文件系统类相关监控项、GPU相关监控项、网卡类相关监控项。

安装Agent后,您便可以查看弹性云服务器的操作系统监控指标。指标采集周期是1分钟。

操作系统监控指标说明

对于不同的操作系统、不同的弹性云服务器类型,在安装Agent后均默认支持查看以下监控指标。

表1 CPU相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

cpu_usage_idle

(Agent)CPU空闲时间占比

该指标用于统计测量对象当前CPU空闲时间占比。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU空闲时间占比。
  • 采集方式(Windows):用户可以通过top命令查看 %Cpu(s) id值。

0-100%

云服务器

1分钟

cpu_usage_other

(Agent)其他CPU使用率

该指标用于统计测量对象其他占用CPU使用率。

单位:百分比

  • 采集方式(Linux):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。
  • 采集方式(Windows):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。

0-100%

云服务器

1分钟

cpu_usage_system

(Agent)内核空间CPU使用率

该指标用于统计测量对象当前内核空间占用CPU使用率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出内核空间CPU使用率。用户可以通过top命令查看 %Cpu(s) sy值。
  • 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。

0-100%

云服务器

1分钟

cpu_usage_user

(Agent)用户空间CPU使用率

该指标用于统计测量对象当前用户空间占用CPU使用率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s) us值。
  • 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。

0-100%

云服务器

1分钟

cpu_usage

(Agent)CPU使用率

该指标用于统计测量对象当前CPU使用率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s)值。
  • 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。

0-100%

云服务器

1分钟

cpu_usage_nice

(Agent)Nice进程CPU使用率

该指标用于统计测量对象当前Nice进程CPU使用率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出Nice进程CPU使用率。用户可以通过top命令查看 %Cpu(s) ni值。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

cpu_usage_iowait

(Agent)iowait状态占比

该指标用于统计测量对象当前iowait状态占用CPU的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出iowait状态占比。用户可以通过top命令查看 %Cpu(s) wa值。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

cpu_usage_irq

(Agent)CPU中断时间占比

该指标用于统计测量对象当前CPU处理中断用时占用CPU时间的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU中断时间占比。用户可以通过top命令查看 %Cpu(s) hi值。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

cpu_usage_softirq

(Agent)CPU软中断时间占比

该指标用于统计测量对象当前CPU处理软中断时间占用CPU时间的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU软中断时间占比。用户可以通过top命令查看 %Cpu(s) si值。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

表2 CPU负载指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

load_average1

(Agent) 1分钟平均负载

该指标用于统计测量对象过去1分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load1/逻辑CPU个数得到。用户可以通过top命令查看load1值。

≥0

云服务器

1分钟

load_average5

(Agent) 5分钟平均负载

该指标用于统计测量对象过去5分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load5/逻辑CPU个数得到。用户可以通过top命令查看load5值。

≥0

云服务器

1分钟

load_average15

(Agent) 15分钟平均负载

该指标用于统计测量对象过去15分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load15/逻辑CPU个数得到。用户可以通过top命令查看load15值。

≥0

云服务器

1分钟

Windows系统暂不支持CPU负载指标。

表3 内存相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

mem_available

(Agent)可用内存

该指标用于统计测量对象的可用内存。

单位:GB

  • 采集方式(Linux):通过/proc/meminfo得到MemAvailable;若/proc/meminfo中不显示MemAvailable,则MemAvailable=MemFree+Buffers+Cached
  • 采集方式(Windows):计算方法为(内存总量-已用内存量)。通过WindowsAPI GlobalMemoryStatusEx获取。

≥0 GB

云服务器

1分钟

mem_usedPercent

(Agent)内存使用率

该指标用于统计测量对象的内存使用率。

单位:百分比

  • 采集方式(Linux):通过/proc/meminfo文件获取,(MemTotal-MemAvailable)/MemTotal
  • 采集方式(Windows):计算方法为( 已用内存量/内存总量*100%)。

0-100%

云服务器

1分钟

mem_free

(Agent)空闲内存量

该指标用于统计测量对象的空闲内存量。

单位:GB

  • 采集方式(Linux):通过/proc/meminfo获取。
  • 采集方式(Windows):暂不支持。

≥0 GB

云服务器

1分钟

mem_buffers

(Agent)Buffers占用量

该指标用于统计测量对象的Buffers内存量。

单位:GB

  • 采集方式(Linux):通过/proc/meminfo获取。用户可以通过top命令查看 KiB Mem:buffers值。
  • 采集方式(Windows):暂不支持。

≥0 GB

云服务器

1分钟

mem_cached

(Agent)Cache占用量

该指标用于统计测量对象Cache内存量。

单位:GB

  • 采集方式(Linux):通过/proc/meminfo获取。用户可以通过top命令查看 KiB Swap:cached Mem值。
  • 采集方式(Windows):暂不支持。

≥0 GB

云服务器

1分钟

表4 磁盘相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

mountPointPrefix_disk_free

(Agent)磁盘剩余存储量

该指标用于统计测量对象磁盘的剩余存储空间。

单位:GB

  • 采集方式(Linux):执行df -h命令,查看Avail列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
  • 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥0 GB

云服务器

1分钟

mountPointPrefix_disk_total

(Agent)磁盘存储总量

该指标用于统计测量对象磁盘存储总量。

单位:GB

  • 采集方式(Linux):执行df -h命令,查看Size列数据。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥0 GB

云服务器

1分钟

mountPointPrefix_disk_used

(Agent)磁盘已用存量

该指标用于统计测量对象磁盘的已用存储空间。

单位:GB

  • 采集方式(Linux):执行df -h命令,查看Used列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
  • 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥0 GB

云服务器

1分钟

mountPointPrefix_disk_usedPercent

(Agent)磁盘使用率

该指标用于统计测量对象磁盘使用率,以百分比为单位。计算方式为: 磁盘已用存储量/磁盘存储总量。

单位:百分比

  • 采集方式(Linux):通过计算Used/Size得出。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
  • 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

0-100%

云服务器

1分钟

表5 磁盘I/O相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

mountPointPrefix_disk_agt_read_bytes_rate

(Agent)磁盘读速率

该指标用于统计每秒从测量对象读出数据量。

单位:byte/s

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化得出磁盘读速率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):
    • 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
    • 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
    • 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。

≥ 0 bytes/s

云服务器

1分钟

mountPointPrefix_disk_agt_read_requests_rate

(Agent)磁盘读操作速率

该指标用于统计每秒从测量对象读取数据的请求次数。

单位:请求/秒

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第四列数据的变化得出磁盘读操作速率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):
    • 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
    • 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
    • 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。

≥ 0 Requests/s

云服务器

1分钟

mountPointPrefix_disk_agt_write_bytes_rate

(Agent)磁盘写速率

该指标用于统计每秒写到测量对象的数据量。

单位:byte/s

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化得出磁盘写速率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):
    • 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
    • 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
    • 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。

≥ 0 bytes/s

云服务器

1分钟

mountPointPrefix_disk_agt_write_requests_rate

(Agent)磁盘写操作速率

该指标用于统计每秒向测量对象写数据的请求次数。

单位:请求/秒

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第八列数据的变化得出磁盘写操作速率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):
    • 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
    • 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
    • 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。

≥ 0 Requests/s

云服务器

1分钟

disk_readTime

(Agent)读操作平均耗时

该指标用于统计测量对象磁盘读操作平均耗时。

单位:ms/count

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第七列数据的变化得出磁盘读操作平均耗时。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 ms/count

云服务器

1分钟

disk_writeTime

(Agent)写操作平均耗时

该指标用于统计测量对象磁盘写操作平均耗时。

单位:ms/count

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十一列数据的变化得出磁盘写操作平均耗时。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 ms/count

云服务器

1分钟

disk_ioUtils

(Agent)磁盘I/O使用率

该指标用于统计测量对象磁盘I/O使用率。

单位:百分比

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化得出磁盘I/O使用率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

disk_queue_length

(Agent)平均队列长度

该指标用于统计指定时间段内,平均等待完成的读取或写入操作请求的数量

单位:个

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十四列数据的变化得出磁盘平均队列长度。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 Counts

云服务器

1分钟

disk_write_bytes_per_operation

(Agent)平均写操作大小

该指标用于统计指定时间段内,平均每个写I/O操作传输的字节数。

单位:byte/op

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化与第八列数据的变化相除得出磁盘平均写操作大小。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 ms/op

云服务器

1分钟

disk_read_bytes_per_operation

(Agent)平均读操作大小

该指标用于统计指定时间段内,平均每个读I/O操作传输的字节数。

单位:byte/op

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化与第四列数据的变化相除得出磁盘平均读操作大小。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 KB/op

云服务器

1分钟

disk_io_svctm

(Agent)平均I/O服务时长

该指标用于统计指定时间段内,平均每个读或写I/O的操作时长。

单位:ms/op

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化与第四列数据和第八列数据和的变化相除得出磁盘平均I/O时长。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 ms/op

云服务器

1分钟

表6 文件系统类监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

disk_fs_rwstate

(Agent)文件系统读写状态

该指标用于统计测量对象挂载文件系统的读写状态。状态分为:可读写(0)/只读(1)。

采集方式(Linux):通过读取/proc/mounts中第四列文件系统挂载参数获得。

0,1

云服务器

1分钟

disk_inodesTotal

(Agent)inode空间大小

该指标用于统计测量对象当前磁盘的inode空间量。

采集方式(Linux):执行df -i命令,查看Inodes列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥ 0

云服务器

1分钟

disk_inodesUsed

(Agent)inode已使用空间

该指标用于统计测量对象当前磁盘已使用的inode空间量。

采集方式(Linux):执行df -i命令,查看IUsed列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥ 0

云服务器

1分钟

disk_inodesUsedPercent

(Agent)inode已使用占比

该指标用于统计测量对象当前磁盘已使用的inode占比。

单位:百分比

采集方式(Linux):执行df -i命令,查看IUse%列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

0-100%

云服务器

1分钟

Windows系统暂不支持文件系统类监控指标。

表7 网卡相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

net_bitRecv

(Agent)出网带宽

该指标用于统计测量对象网卡每秒发送的比特数。

单位:bit/s

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。

≥ 0 bits/s

云服务器

1分钟

net_bitSent

(Agent)入网带宽

该指标用于统计测量对象网卡每秒接收的比特数。

单位:bit/s

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。

≥ 0 bits/s

云服务器

1分钟

net_packetRecv

(Agent)网卡包接收速率

该指标用于统计测量对象网卡每秒接收的数据包数。

单位:Count/s

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。

≥ 0 counts/s

云服务器

1分钟

net_packetSent

(Agent)网卡包发送速率

该指标用于统计测量对象网卡每秒发送的数据包数。

单位:Count/s

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。

≥ 0 counts/s

云服务器

1分钟

net_errin

(Agent)接收误包率

该指标用于统计测量对象网卡每秒接收的错误数据包数量占所接收的数据包的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

net_errout

(Agent)发送误包率

该指标用于统计测量对象网卡每秒发送的错误数据包数量占所发送的数据包的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

net_dropin

(Agent)接收丢包率

该指标用于统计测量对象网卡每秒接收并已丢弃的数据包数量占所接收的数据包的比率

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

net_dropout

(Agent)发送丢包率

该指标用于统计测量对象网卡每秒发送并已丢弃的数据包数量占所发送的数据包的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

表8 进程类监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

proc_pHashId_cpu

进程CPU使用率

进程消耗的CPU百分比,pHashId是(进程名+进程ID)的md5值。

单位:百分比

  • 采集方式(Linux):通过计算/proc/pid/stat的变化得出。
  • 采集方式(Windows):通过Windows API GetProcessTimes获取进程CPU使用率。

0-100%

云服务器

1分钟

proc_pHashId_mem

进程内存使用率

进程消耗的内存百分比,pHashId是(进程名+进程ID)的md5值。

单位:百分比

  • 采集方式(Linux):

    RSS*PAGESIZE/MemTotal

    RSS: 通过获取/proc/pid/statm第二列得到

    PAGESIZE: 通过命令getconf PAGESIZE获取

    MemTotal:通过/proc/meminfo获取

  • 采集方式(Windows):使用Windows API procGlobalMemoryStatusEx获取内存总量,通过GetProcessMemoryInfo获取内存已使用量,计算两者比值得到内存使用率。

0-100%

云服务器

1分钟

proc_pHashId_file

进程打开文件数

进程打开文件数,pHashId是(进程名+进程ID)的md5值。

  • 采集方式(Linux):通过执行ls -l /proc/pid/fd 可以查看数量。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_running_count

运行中进程数

该指标用于统计测量对象处于运行状态的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_idle_count

空闲进程数

该指标用于统计测量对象处于空闲状态的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_zombie_count

僵死进程数

该指标用于统计测量对象处于僵死状态的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_blocked_count

阻塞进程数

该指标用于统计测量对象被阻塞的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_sleeping_count

睡眠进程数

该指标用于统计测量对象处于睡眠状态的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_total_count

系统进程数

该指标用于统计测量对象的总进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):通过psapi.dll系统进程状态支持模块得到进程总数。

≥0

云服务器

1分钟

表9 GPU类监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

slot0_gpu_performance_state

性能状态

该指标用于统计测量对象当前的性能状态。

该指标无单位。

采集方式(Linux):执行nvidia-smi命令,查看Perf列数据。

P0-P15、P32,

P0表示最大性能状态,P15表示最小性能状态,P32表示状态未知。

GPU云服务器

1分钟

slot0_gpu_usage_mem

显存使用率

该指标用于统计测量对象当前的显存使用率。

单位:百分比

采集方式(Linux):执行nvidia-smi命令,查看Memory-Usage列数据。

0-100%

GPU云服务器

1分钟

slot0_gpu_usage_gpu

GPU利用率

该指标用于统计测量对象当前的GPU利用率。

单位:百分比

采集方式(Linux):执行nvidia-smi命令,查看GPU-Util列数据。

0-100%

GPU云服务器

1分钟

Windows系统暂不支持GPU类监控指标。

维度

Key

Value

instance_id

云服务器ID

分享:

    相关文档

    相关产品