更新时间:2022-08-16 GMT+08:00

负载监控

进入负载监控页面

  1. 登录GaussDB(DWS) 管理控制台。
  2. 在“集群管理”页面,找到需要查看监控的集群。
  3. 在指定集群所在行的“操作”列,单击“监控面板”,系统将显示数据库监控页面。
  4. 在左侧导航栏选择“监控>负载监控”,进入负载监控页面。

    在负载监控页面展示工作负载队列的实时信息和工作负载队列资源消耗的历史信息。

工作负载队列

DMS可显示用户定义的工作负载队列名称,实时/历史资源消耗以及工作负载队列资源配额。

  • 工作负载队列:工作负载队列名称。
  • 监控:单击弹出侧拉栏展示CPU,内存,磁盘等工作负载队列资源的消耗历史趋势。
  • CPU使用率(%):工作负载队列的实时CPU计算资源使用率。
  • CPU资源(%):工作负载队列的CPU资源使用率配额。
  • 实时短查询并发:工作负载队列的简单查询并发数使用量(判定为简单并发的查询不受工作负载队列的管控)。
  • 短查询并发:工作负载队列的简单并发数配额。
  • 实时查询并发:工作负载队列的复杂查询并发数使用量(判定为复杂并发的查询受工作负载队列的管控)。
  • 查询并发:工作负载队列的复杂并发数配额。
  • 操作

异常处理规则

单击任意工作负载队列的下拉菜单,可以展示该工作负载队列上配置的异常处理规则。

  • 规则名称:异常处理规则支持的规则类型。如下所示:
    • blocktime:查询的阻塞时间,单位s。
    • elapsedtime:查询的已被执行时间,单位s。
    • allcputime:查询在所有DN上执行时所耗费的CPU总时间,单位s。
    • cpuskewpercent:查询在DN上执行时的CPU时间的倾斜率,依赖于qualificationtime的设置。
    • qualificationtime:检查查询执行CPU倾斜率的间隔时间,单位s,需同cpuskewpercent一起设置。
    • spillsize:查询在DN上下盘的数据量,单位MB。
    • broadcastsize:查询在DN上算子大表广播数据量,单位MB。
    • mem_limit: 作业在单实例上使用内存上限,单位MB。
  • 规则类型:可支持的异常操作类型(abort,penalty)。
  • 规则值:规则阈值,取值区间 0~UINT_MAX。

工作负载队列上的等待查询

用户可以实时查看工作负载队列上的等待作业情况,帮助用户识别工作负载队列上的业务压力。

  • 用户名:查询语句的用户名称。
  • 应用名称:查询语句的应用名称。
  • 数据库:查询语句所连接的数据库名称。
  • 排队状态:查询语句在工作负载队列中的排队状态。
  • 等待时间(ms):查询语句执行前的等待时间,单位ms。
  • 所属工作负载队列: 查询语句所属的工作负载队列。
  • 查询语句:用户提交的查询语句的详细内容。

熔断查询

用户可以通过熔断查询查看工作负载队列上的熔断规则的触发情况。

  • 查询ID:熔断语句的查询ID。
  • 查询语句:熔断查询语句。
  • 阻塞时间(ms):熔断语句的阻塞时间,单位ms。
  • 执行时间(ms):熔断语句的执行时间,单位ms。
  • CPU时间(ms):熔断语句消耗的CPU时间,单位ms。
  • CPU倾斜率(%):熔断语句在各个DN上的CPU消耗倾斜率。
  • 异常处理方式:熔断语句的异常处理方式。
  • 处理状态:处理熔断语句的实时状态。