文档首页 > > 用户指南> 监控> 弹性云服务器操作系统监控的监控指标(安装Agent)

弹性云服务器操作系统监控的监控指标(安装Agent)

分享
更新时间: 2019/12/04 GMT+08:00

安装Agent后,您便可以查看弹性云服务器的操作系统监控指标。指标采集周期是1分钟。

操作系统监控目前支持监控的监控指标有:CPU相关监控项、CPU负载类相关监控项、内存相关监控项、磁盘相关监控项、磁盘I/O相关监控项、文件系统类相关监控项、GPU相关监控项、网卡类相关监控项。

对于不同的操作系统、不同的弹性云服务器类型,在安装Agent后均默认支持查看以下监控指标。

表1 CPU相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

cpu_usage_idle

(Agent)CPU空闲时间占比

该指标用于统计测量对象当前CPU空闲时间占比。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU空闲时间占比。
  • 采集方式(Windows):用户可以通过top命令查看 %Cpu(s) id值。

0-100%

云服务器

1分钟

cpu_usage_other

(Agent)其他CPU使用率

该指标用于统计测量对象其他占用CPU使用率。

单位:百分比

  • 采集方式(Linux):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。
  • 采集方式(Windows):其他CPU使用率=1- 空闲CPU使用率(%)- 内核空间CPU使用率- 用户空间CPU使用率。

0-100%

云服务器

1分钟

cpu_usage_system

(Agent)内核空间CPU使用率

该指标用于统计测量对象当前内核空间占用CPU使用率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出内核空间CPU使用率。用户可以通过top命令查看 %Cpu(s) sy值。
  • 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。

0-100%

云服务器

1分钟

cpu_usage_user

(Agent)用户空间CPU使用率

该指标用于统计测量对象当前用户空间占用CPU使用率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s) us值。
  • 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。

0-100%

云服务器

1分钟

cpu_usage

(Agent)CPU使用率

该指标用于统计测量对象当前CPU使用率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu使用率。用户可以通过top命令查看 %Cpu(s)值。
  • 采集方式(Windows):通过WindowsAPI GetSystemTimes获取。

0-100%

云服务器

1分钟

cpu_usage_nice

(Agent)Nice进程CPU使用率

该指标用于统计测量对象当前Nice进程CPU使用率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出Nice进程CPU使用率。用户可以通过top命令查看 %Cpu(s) ni值。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

cpu_usage_iowait

(Agent)iowait状态占比

该指标用于统计测量对象当前iowait状态占用CPU的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出iowait状态占比。用户可以通过top命令查看 %Cpu(s) wa值。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

cpu_usage_irq

(Agent)CPU中断时间占比

该指标用于统计测量对象当前CPU处理中断用时占用CPU时间的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU中断时间占比。用户可以通过top命令查看 %Cpu(s) hi值。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

cpu_usage_softirq

(Agent)CPU软中断时间占比

该指标用于统计测量对象当前CPU处理软中断时间占用CPU时间的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出CPU软中断时间占比。用户可以通过top命令查看 %Cpu(s) si值。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

表2 CPU负载指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

load_average1

(Agent) 1分钟平均负载

该指标用于统计测量对象过去1分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load1/逻辑CPU个数得到。用户可以通过top命令查看load1值。

≥0

云服务器

1分钟

load_average5

(Agent) 5分钟平均负载

该指标用于统计测量对象过去5分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load5/逻辑CPU个数得到。用户可以通过top命令查看load5值。

≥0

云服务器

1分钟

load_average15

(Agent) 15分钟平均负载

该指标用于统计测量对象过去15分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load15/逻辑CPU个数得到。用户可以通过top命令查看load15值。

≥0

云服务器

1分钟

Windows系统暂不支持CPU负载指标。

表3 内存相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

mem_available

(Agent)可用内存

该指标用于统计测量对象的可用内存。

单位:GB

  • 采集方式(Linux):通过/proc/meminfo得到MemAvailable;若/proc/meminfo中不显示MemAvailable,则MemAvailable=MemFree+Buffers+Cached
  • 采集方式(Windows):计算方法为(内存总量-已用内存量)。通过WindowsAPI GlobalMemoryStatusEx获取。

≥0 GB

云服务器

1分钟

mem_usedPercent

(Agent)内存使用率

该指标用于统计测量对象的内存使用率。

单位:百分比

  • 采集方式(Linux):通过/proc/meminfo文件获取,(MemTotal-MemAvailable)/MemTotal
  • 采集方式(Windows):计算方法为( 已用内存量/内存总量*100%)。

0-100%

云服务器

1分钟

mem_free

(Agent)空闲内存量

该指标用于统计测量对象的空闲内存量。

单位:GB

  • 采集方式(Linux):通过/proc/meminfo获取。
  • 采集方式(Windows):暂不支持。

≥0 GB

云服务器

1分钟

mem_buffers

(Agent)Buffers占用量

该指标用于统计测量对象的Buffers内存量。

单位:GB

  • 采集方式(Linux):通过/proc/meminfo获取。用户可以通过top命令查看 KiB Mem:buffers值。
  • 采集方式(Windows):暂不支持。

≥0 GB

云服务器

1分钟

mem_cached

(Agent)Cache占用量

该指标用于统计测量对象Cache内存量。

单位:GB

  • 采集方式(Linux):通过/proc/meminfo获取。用户可以通过top命令查看 KiB Swap:cached Mem值。
  • 采集方式(Windows):暂不支持。

≥0 GB

云服务器

1分钟

表4 磁盘相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

mountPointPrefix_disk_free

(Agent)磁盘剩余存储量

该指标用于统计测量对象磁盘的剩余存储空间。

单位:GB

  • 采集方式(Linux):执行df -h命令,查看Avail列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
  • 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥0 GB

云服务器

1分钟

mountPointPrefix_disk_total

(Agent)磁盘存储总量

该指标用于统计测量对象磁盘存储总量。

单位:GB

  • 采集方式(Linux):执行df -h命令, 查看Size列数据。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥0 GB

云服务器

1分钟

mountPointPrefix_disk_used

(Agent)磁盘已用存量

该指标用于统计测量对象磁盘的已用存储空间。

单位:GB

  • 采集方式(Linux):执行df -h命令 ,查看Used列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
  • 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥0 GB

云服务器

1分钟

mountPointPrefix_disk_usedPercent

(Agent)磁盘使用率

该指标用于统计测量对象磁盘使用率,以百分比为单位。计算方式为: 磁盘已用存储量/磁盘存储总量。

单位:百分比

  • 采集方式(Linux):通过计算Used/Size得出。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
  • 采集方式(Windows):使用WMI接口GetDiskFreeSpaceExW获取磁盘空间数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

0-100%

云服务器

1分钟

表5 磁盘I/O相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

mountPointPrefix_disk_agt_read_bytes_rate

(Agent)磁盘读速率

该指标用于统计每秒从测量对象读出数据量。

单位:byte/s

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化得出磁盘读速率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):
    • 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
    • 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
    • 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。

≥ 0 bytes/s

云服务器

1分钟

mountPointPrefix_disk_agt_read_requests_rate

(Agent)磁盘读操作速率

该指标用于统计每秒从测量对象读取数据的请求次数。

单位:请求/秒

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第四列数据的变化得出磁盘读操作速率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):
    • 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
    • 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
    • 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。

≥ 0 Requests/s

云服务器

1分钟

mountPointPrefix_disk_agt_write_bytes_rate

(Agent)磁盘写速率

该指标用于统计每秒写到测量对象的数据量。

单位:byte/s

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化得出磁盘写速率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):
    • 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
    • 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
    • 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。

≥ 0 bytes/s

云服务器

1分钟

mountPointPrefix_disk_agt_write_requests_rate

(Agent)磁盘写操作速率

该指标用于统计每秒向测量对象写数据的请求次数。

单位:请求/秒

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第八列数据的变化得出磁盘写操作速率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):
    • 使用WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk对象获取磁盘I/O数据。
    • 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
    • 高CPU情况下存在获取超时的现象,会导致无法获取监控数据。

≥ 0 Requests/s

云服务器

1分钟

disk_readTime

(Agent)读操作平均耗时

该指标用于统计测量对象磁盘读操作平均耗时。

单位:ms/count

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第七列数据的变化得出磁盘读操作平均耗时。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 ms/count

云服务器

1分钟

disk_writeTime

(Agent)写操作平均耗时

该指标用于统计测量对象磁盘写操作平均耗时。

单位:ms/count

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十一列数据的变化得出磁盘写操作平均耗时。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 ms/count

云服务器

1分钟

disk_ioUtils

(Agent)磁盘I/O使用率

该指标用于统计测量对象磁盘I/O使用率。

单位:百分比

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化得出磁盘I/O使用率。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

disk_queue_length

(Agent)平均队列长度

该指标用于统计指定时间段内,平均等待完成的读取或写入操作请求的数量

单位:个

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十四列数据的变化得出磁盘平均队列长度。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 Counts

云服务器

1分钟

disk_write_bytes_per_operation

(Agent)平均写操作大小

该指标用于统计指定时间段内,平均每个写I/O操作传输的字节数。

单位:ms/op

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化与第八列数据的变化相除得出磁盘平均写操作大小。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 ms/op

云服务器

1分钟

disk_read_bytes_per_operation

(Agent)平均读操作大小

该指标用于统计指定时间段内,平均每个读I/O操作传输的字节数。

单位:KB/op

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化与第四列数据的变化相除得出磁盘平均读操作大小。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 KB/op

云服务器

1分钟

disk_io_svctm

(Agent)平均I/O服务时长

该指标用于统计指定时间段内,平均每个读或写I/O的操作时长。

单位:ms/op

  • 采集方式(Linux):

    通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化与第四列数据和第八列数据和的变化相除得出磁盘平均I/O时长。

    挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

  • 采集方式(Windows):暂不支持。

≥ 0 ms/op

云服务器

1分钟

表6 文件系统类监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

disk_fs_rwstate

(Agent)文件系统读写状态

该指标用于统计测量对象挂载文件系统的读写状态。状态分为:可读写(0)/只读(1)。

采集方式(Linux):通过读取/proc/mounts中第四列文件系统挂载参数获得。

0,1

云服务器

1分钟

disk_inodesTotal

(Agent)inode空间大小

该指标用于统计测量对象当前磁盘的inode空间量。

采集方式(Linux):执行df -i命令,查看Inodes列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥ 0

云服务器

1分钟

disk_inodesUsed

(Agent)inode已使用空间

该指标用于统计测量对象当前磁盘已使用的inode空间量。

采集方式(Linux):执行df -i命令,查看IUsed列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

≥ 0

云服务器

1分钟

disk_inodesUsedPercent

(Agent)inode已使用占比

该指标用于统计测量对象当前磁盘已使用的inode占比。

单位:百分比

采集方式(Linux):执行df -i命令,查看IUse%列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

0-100%

云服务器

1分钟

Windows系统暂不支持文件系统类监控指标。

表7 网卡相关监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

net_bitRecv

(Agent)出网带宽

该指标用于统计测量对象网卡每秒发送的比特数。

单位:bit/s

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。

≥ 0 bits/s

云服务器

1分钟

net_bitSent

(Agent)入网带宽

该指标用于统计测量对象网卡每秒接收的比特数。

单位:bit/s

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。

≥ 0 bits/s

云服务器

1分钟

net_packetRecv

(Agent)网卡包接收速率

该指标用于统计测量对象网卡每秒接收的数据包数。

单位:Count/s

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。

≥ 0 counts/s

云服务器

1分钟

net_packetSent

(Agent)网卡包发送速率

该指标用于统计测量对象网卡每秒发送的数据包数。

单位:Count/s

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):使用WMI中MibIfRow对象获取网络指标数据。

≥ 0 counts/s

云服务器

1分钟

net_errin

(Agent)接收误包率

该指标用于统计测量对象网卡每秒接收的错误数据包数量占所接收的数据包的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

net_errout

(Agent)发送误包率

该指标用于统计测量对象网卡每秒发送的错误数据包数量占所发送的数据包的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

net_dropin

(Agent)接收丢包率

该指标用于统计测量对象网卡每秒接收并已丢弃的数据包数量占所接收的数据包的比率

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

net_dropout

(Agent)发送丢包率

该指标用于统计测量对象网卡每秒发送并已丢弃的数据包数量占所发送的数据包的比率。

单位:百分比

  • 采集方式(Linux):通过计算采集周期内/proc/net/dev中的变化得出。
  • 采集方式(Windows):暂不支持。

0-100%

云服务器

1分钟

表8 进程类监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

proc_pHashId_cpu

进程CPU使用率

进程消耗的CPU百分比,pHashId是(进程名+进程ID)的md5值。

单位:百分比

  • 采集方式(Linux):通过计算/proc/pid/stat的变化得出。
  • 采集方式(Windows):通过Windows API GetProcessTimes获取进程CPU使用率。

0-100%

云服务器

1分钟

proc_pHashId_mem

进程内存使用率

进程消耗的内存百分比,pHashId是(进程名+进程ID)的md5值。

单位:百分比

  • 采集方式(Linux):

    RSS*PAGESIZE/MemTotal

    RSS: 通过获取/proc/pid/statm第二列得到

    PAGESIZE: 通过命令getconf PAGESIZE获取

    MemTotal:通过/proc/meminfo获取

  • 采集方式(Windows):使用Windows API procGlobalMemoryStatusEx获取内存总量,通过GetProcessMemoryInfo获取内存已使用量,计算两者比值得到内存使用率。

0-100%

云服务器

1分钟

proc_pHashId_file

进程打开文件数

进程打开文件数,pHashId是(进程名+进程ID)的md5值。

  • 采集方式(Linux):通过执行ls -l /proc/pid/fd 可以查看数量。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_running_count

运行中进程数

该指标用于统计测量对象处于运行状态的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_idle_count

空闲进程数

该指标用于统计测量对象处于空闲状态的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_zombie_count

僵死进程数

该指标用于统计测量对象处于僵死状态的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_blocked_count

阻塞进程数

该指标用于统计测量对象被阻塞的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_sleeping_count

睡眠进程数

该指标用于统计测量对象处于睡眠状态的进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):暂不支持。

≥0

云服务器

1分钟

proc_total_count

系统进程数

该指标用于统计测量对象的总进程数。

  • 采集方式(Linux):通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。
  • 采集方式(Windows):通过psapi.dll系统进程状态支持模块得到进程总数。

≥0

云服务器

1分钟

表9 GPU类监控指标说明

指标

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

slot0_gpu_performance_state

性能状态

该指标用于统计测量对象当前的性能状态。

该指标无单位。

采集方式(Linux):执行nvidia-smi命令,查看Perf列数据。

P0-P15、P32,

P0表示最大性能状态,P15表示最小性能状态,P32表示状态未知。

GPU云服务器

1分钟

slot0_gpu_usage_mem

显存使用率

该指标用于统计测量对象当前的显存使用率。

单位:百分比

采集方式(Linux):执行nvidia-smi命令,查看Memory-Usage列数据。

0-100%

GPU云服务器

1分钟

slot0_gpu_usage_gpu

GPU利用率

该指标用于统计测量对象当前的GPU利用率。

单位:百分比

采集方式(Linux):执行nvidia-smi命令,查看GPU-Util列数据。

0-100%

GPU云服务器

1分钟

Windows系统暂不支持GPU类监控指标。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区