文档首页> 数据仓库服务 GaussDB(DWS)> 管理指南> 监控与告警> 告警管理> 告警处理> DWS_2000000009 节点数据盘I/O利用率超阈值(Node Data Disk I/O Usage Exceeds the Threshold)
更新时间:2024-03-28 GMT+08:00

DWS_2000000009 节点数据盘I/O利用率超阈值(Node Data Disk I/O Usage Exceeds the Threshold)

告警解释

GaussDB(DWS)每30秒采集集群各节点的数据盘I/O利用率。如果某节点的某数据盘最近10分钟(可配置)内的平均使用率超过90%(可配置),则上报节点数据盘I/O利用率超阈值告警;如果平均使用率低于85%(即上报阈值减去5%),则消除告警。

如果节点数据盘I/O利用率一直大于上报阈值,那么在24小时(可配置)后将再次发起告警。

告警属性

告警ID

告警级别

是否可自动清除

DWS_2000000009

紧急

告警参数

参数名称

参数含义

告警源

产生告警的系统名称。例如,DWS。

集群名称

产生告警的集群名称。

定位信息

产生告警的集群ID、集群名称、实例ID、实例名称。例如,cluster_id: xxxx-xxxx-xxxx-xxxx,cluster_name: test_dws,instance_id: xxxx-xxxx-xxxx-xxxx,instance_name: test_dws-dws-cn-cn-1-1

详细信息

产生告警的详细信息,包括集群、实例、磁盘、阈值信息。例如:CloudService=DWS, resourceId=xxxx-xxxx-xxxx-xxxx,resourceIdName=test_dws, instance_id: xxxx-xxxx-xxxx-xxxx,instance_name: test_dws-dws-cn-cn-1-1,host_name: host-192-168-1-122,disk_name: /dev/vdb,first_alarm_time: 2022-01-30 10:30:00; 节点10分钟内的日志盘I/O使用率为90.54%,超过阈值90%

产生日期

产生告警的时间。

状态

当前告警的处理状态。

对系统的影响

  • 磁盘I/O利用率高会影响数据的读取和写入性能,从而影响集群性能。
  • 大量的磁盘写入会占用磁盘容量,当磁盘容量高于90%会造成集群只读等。

可能原因

  • 用户业务高峰,存在大量的读取或写入。
  • 复杂语句执行造成大量下盘。
  • Scan算子扫描等。

处理步骤

  1. 进入专属集群页面,单击指定集群所在行操作列的“监控面板”按钮进入触发告警的集群的监控面板。
  2. 在左侧导航栏选择“监控>节点监控”,切换至“磁盘”模块查看数据盘I/O使用率、磁盘I/O速率等信息。

    如果磁盘I/O速率高,数据盘使用率持续上升,说明有业务在写入数据或存在复杂查询导致大量下盘,用户可结合自身业务情况进行判断。

  3. 单击左侧导航栏的“实时查询”按钮进入实时查询页面,查看当前进行的实时查询。

    如果存在执行时间超过预期的语句,可尝试对语句执行“终止查询”操作后再查看磁盘I/O使用率。请参见2

告警清除

数据盘I/O利用率下降后,自动消除告警。