更新时间:2022-08-16 GMT+08:00

查看进程监控

进程监控是针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。当您配置了自定义进程监控,还会监控包含关键字的进程个数。

插件会每分钟统计一次1分钟内消耗 CPU Top5的进程,Top5的进程不固定,进程列表中会展示出最近24小时内所有消耗CPU Top5的进程。

查看进程监控需安装操作系统监控插件Agent。

查询系统进程数

云监控服务在您安装插件后,会默认展示系统的进程数据。

查询系统进程数的操作步骤

  1. 登录管理控制台。
  2. 单击“服务列表 > 云监控服务”。
  3. 单击页面左侧的“主机监控”,进入“主机监控”页面。
  4. 在“主机监控”页面,单击资源所在行的“监控状态”开关,开启“操作系统监控”功能。

    请确保您想要查询系统进程的全部资源均已开启“操作系统监控”功能,未开启的资源无法查询系统进程数据。

  5. 单击资源所在行的“查看监控指标”,进入“操作系统监控”页面。
  6. 单击“操作系统监控”右侧的“进程监控”,进入“进程监控”页面。
    在“系统进程数”页面,展示了主机上运行的进程数据。系统进程查询结果的指标说明如表1所示。
    表1 系统进程数查询结果指标说明

    指标名称

    指标含义

    取值范围

    采集方式(Linux)

    采集方式(Windows)

    运行中进程数

    该指标用于统计测量对象处于运行状态的进程数。

    ≥ 0

    测量对象:云服务器或裸金属服务器

    通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。

    不支持

    空闲进程数

    该指标用于统计测量对象处于空闲状态的进程数。

    ≥ 0

    测量对象:云服务器或裸金属服务器

    通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。

    不支持

    僵死进程数

    该指标用于统计测量对象处于僵死状态的进程数。

    ≥ 0

    测量对象:云服务器或裸金属服务器

    通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。

    不支持

    阻塞进程数

    该指标用于统计测量对象被阻塞的进程数。

    ≥ 0

    测量对象:云服务器或裸金属服务器

    通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。

    不支持

    睡眠进程数

    该指标用于统计测量对象处于睡眠状态的进程数。

    ≥ 0

    测量对象:云服务器或裸金属服务器

    通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。

    不支持

    系统进程数

    该指标用于统计测量对象的总进程数。

    ≥ 0

    测量对象:云服务器或裸金属服务器

    通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。

    测量对象:云服务器或裸金属服务器

    通过psapi.dll系统进程状态支持模块得到进程总数。

查看TOP CPU进程的运行数据

  • 云监控服务插件会每分钟统计一次消耗 CPU Top5的进程,Top5的进程不固定,进程列表中会展示出最近24小时内所有消耗CPU Top5的进程。
  • 查询进程CPU使用率与内存使用率的命令:top
  • 查询当前进程打开文件数命令:lsof或ls /proc/pid/fd |wc -l ,其中pid需要替换为待查询的进程ID。
    • 当某个进程占用多个CPU时,由于采集结果为多个CPU的总使用率,因此会出现CPU使用率超过100%的现象。
    • TOP5进程不固定,进程列表中展示的是近24小时内按一分钟统计周期进入过TOP5的进程。
    • 只有近24小时内进入过TOP5的进程并开启了监控开关的进程才会采集CPU使用率、内存使用率和打开文件数。如满足上述条件的进程已被关闭时,则不会展示此进程的相关数据。
    • 列表中的时间表示该进程创建的时间。
    • 客户端浏览器的时间如果和被监控弹性云服务器的时间不一致,可能会出现监控图表无指标数据的情况,请调整本地时间和主机时间保持一致。

查询Top CPU进程数据的操作步骤

  1. 登录管理控制台。
  2. 单击“服务列表 > 云监控服务”。
  3. 单击页面左侧的“主机监控”,进入“主机监控”页面。
  4. 在“主机监控”页面,单击资源所在行的“监控状态”开关,开启“操作系统监控”功能。
  5. 单击资源所在行的“查看监控指标”,进入“操作系统监控”页面。
  6. 单击“操作系统监控”右侧的“进程监控”,进入“进程监控”页面。
  7. 单击“监控进程列表”右侧的,进入TOP进程列表。
  8. 在TOP进程列表中打开您要开启的进程的“监控开关”,单击确定。

    在“监控进程列表”页面,系统会默认勾选状态为“运行中”的进程,在下方的监控图表中显示出当前进程的“近1小时”CPU使用率的原始监控数据曲线图。

    您也可以勾选需要显示的进程,在下方的监控图表中显示出当前进程的“近1小时”CPU使用率的原始监控数据曲线图。

    单击监控图表上方的CPU 使用率、内存使用率、打开文件数可查看当前进程的不同指标的数据曲线图,相关指标说明请参见表2

    表2 进程监控相关指标说明

    指标名称

    指标含义

    取值范围

    采集方式(Linux)

    采集方式(Windows)

    CPU使用率

    进程消耗的CPU百分比。

    pHashId是(进程名+进程ID)的md5值。

    0-1

    测量对象:云服务器或裸金属服务器

    通过计算/proc/pid/stat的变化得出。

    测量对象:云服务器或裸金属服务器

    通过Windows API GetProcessTimes获取进程CPU使用率。

    内存使用率

    进程消耗的内存百分比,pHashId是(进程名+进程ID)的md5值。

    0-1

    测量对象:云服务器或裸金属服务器

    计算方式:RSS*PAGESIZE/MemTotal

    RSS: 通过获取/proc/pid/statm第二列得到。

    PAGESIZE: 通过命令getconf PAGESIZE获取。

    MemTotal:通过/proc/meminfo获取。

    测量对象:云服务器或裸金属服务器

    使用Windows API procGlobalMemoryStatusEx获取内存总量,通过GetProcessMemoryInfo获取内存已使用量,计算两者比值得到内存使用率。

    打开文件数

    进程消耗的打开文件数。

    pHashId是(进程名+进程ID)的md5值。

    ≥ 0

    测量对象:云服务器或裸金属服务器

    通过执行ls -l /proc/pid/fd命令可以查看数量。

    暂不支持

  9. 在监控指标视图右上角,单击可查看监控指标视图详情。

    页面左上方提供查看“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”和“近30天”6个固定时长的监控周期,同时也支持以通过“自定义时间段”选择查看近六个月内任意时间段的历史监控数据。

    选择页面左上方的“设置”按钮,进入“聚合”设置页面,对监控数据的聚合方法进行更改。