更新时间:2025-09-03 GMT+08:00
分享

1078919265 DWS数据库磁盘剩余容量不足

告警解释

当检测到磁盘使用率或inode使用率达到90%,将触发该告警信息,并将集群设置为只读。当检测到集群实例的磁盘使用率或inode使用率低于90%时,将消除该告警。

告警属性

告警ID

告警归属

告警级别

告警类型

业务类型

是否可自动清除

1078919265

租户面

紧急

操作告警

DWS实例集群

告警参数

不同告警,具体的参数项个数存在差异。

类别

参数名称

参数含义

定位信息

instance_id

产生告警的实例ID。

instance_name

产生告警的实例名称。

domain_name

产生告警的域名。

domain_id

产生告警的域名ID。

datastore_type

产生告警的数据存储类型。

instance_role

产生告警的实例角色。

component_instance_name

产生告警的组件实例名称,例如cn_5001。

附加信息

CloudService

产生告警的云服务。

resourceId

产生告警的资源ID信息。

resourceIdName

产生告警的资源ID名称。

domain_name

产生告警的域名。

domain_id

产生告警的域名ID。

对系统的影响

集群状态只读,无法正常写入、修改数据。

系统自处理过程

无。

可能原因

集群磁盘使用率或inode使用率超过90%导致集群变为只读状态,数据无法正常写入、修改。

处理步骤

  1. 集群处于“只读”状态时,应立即停止写入任务,避免磁盘被写满造成数据丢失的风险。
  2. 集群进入只读状态时,通过登录DWS管理控制台,解除只读状态。详情请参见解除只读

    1. 登录DWS管理控制台
    2. 左导航选择“集群 > 集群列表”。默认显示用户所有的集群列表。
    3. 在集群列表中,在指定集群所在行的“操作”列,选择更多 > 解除只读
    4. 在弹出对话框中,单击“是”,再次进行解除只读确认,对集群进行解除只读操作。

  3. 解除只读操作成功后,通过Vacuum清理相关的无用数据。单击指定集群名称。
  4. 进入“集群详情”页面,切换至“智能运维”页签。
  5. 在运维详情部分切换至运维计划模块。单击“添加运维任务”按钮。详情请参见添加运维计划
  6. 弹出添加运维任务边栏。

    • 运维任务选择“Vacuum”。
    • 调度模式选择“自动”,DWS将自动扫描Vacuum目标。
    • Vacuum目标选择系统表或用户表:
      • 如果用户业务UPDATE、DELETE较多,选择用户表。
      • 如果创建表、删除表较多,选择系统表。

  7. 单击“下一步:定时配置”,配置Vacuum类型,推荐选择“周期型任务”,DWS将自动在自定义时间窗内执行Vacuum。

    对于自动Vacuum运维任务,系统对于用户表的处理方法实际采用的是VACUUM FULL操作。VACUUM FULL执行过程中,本身持有8级锁,会阻塞其他业务,导致锁冲突产生,业务本身会陷入锁等待,20分钟后超时报错。因此,在用户配置时间窗内,应尽量避开执行所有处理表的相关业务。

  8. 确认无误后,单击“下一步:配置确认”,完成配置。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

相关文档