更新时间:2024-10-10 GMT+08:00

自动清理

系统自动清理进程(autovacuum)自动执行VACUUM和ANALYZE命令,回收被标识为删除状态的记录空间,并更新表的统计数据。

autovacuum

参数说明:控制是否启动数据库自动清理进程(autovacuum)。自动清理进程运行的前提是将track_counts设置为on。

8.1.3及以上集群版本的自动清理功能已支持通过管理控制台操作,详情请参考智能运维概览章节,8.1.2及以下集群版本按照设置GUC参数的方式进行操作。

参数类型:SIGHUP

取值范围:布尔型

  • on表示开启数据库自动清理进程。
  • off表示关闭数据库自动清理进程。

默认值:on

如系统在故障恢复后,需具备自动清理两阶段事务的功能,请将autovacuum设置为on。
  • 当设置autovacuum为on,autovacuum_max_workers为0时,表示系统不会自动进行autovacuum,只会在故障恢复后,自动清理两阶段事务。
  • 当设置autovacuum为on,autovacuum_max_workers大于0时,表示系统不仅在故障恢复后,自动清理两阶段事务,并且还可以自动清理进程。
即使此参数设置为off,数据库也会在需要防止事务ID回卷时发起清理进程。对于CREATE/DROP DATABASE发生异常时,可能有的节点提交或回滚,有的节点未提交(prepared状态),此时系统不能自动修复,需要手动修复,修复步骤:
  1. 使用gs_clean工具(-N参数)查询出异常两阶段事务的xid以及处于prepared的节点。
  2. 登录事务处于prepared状态的节点,系统管理员连接一个可用的数据库(如gaussdb),执行语句SET xc_maintenance_mode = on。
  3. 根据事务全局状态提交或者回滚此两阶段事务(如提交语句、回滚语句)。

autovacuum_mode

参数说明:该参数仅在autovacuum设置为on的场景下生效,它控制autoanalyze或autovacuum的打开情况。

参数类型:SIGHUP

取值范围:枚举类型

  • analyze表示只执行autoanalyze。
  • vacuum表示只执行autovacuum。
  • mix表示autoanalyze和autovacuum都执行。
  • none表示二者都不执行。

默认值:mix

autoanalyze_timeout

参数说明:设置autoanalyze的超时时间。在对某张表做autoanalyze时,如果该表的analyze时长超过了autoanalyze_timeout,则自动取消该表此次analyze。

参数类型:SIGHUP

取值范围:整型,0~2147483,单位为秒(s)。

默认值:5min

autovacuum_io_limits

参数说明:控制autovacuum进程每秒触发IO的上限。该参数8.1.2版本中已废弃,为兼容历史版本功能保留该函数,当前版本设置无效。

参数类型:SIGHUP

取值范围:整型,-1~1073741823。其中-1表示不控制,而是使用系统默认控制组。

默认值:-1

autovacuum_max_workers

参数说明:设置能同时运行的自动清理线程的最大数量。

参数类型:SIGHUP

取值范围:整型,0~128 。其中0表示不会自动进行autovacuum。

默认值:3

  • 该参数与autovacuum共同发挥作用,对系统表和用户表的清理规则如下:
    • autovacuum_max_workers = 0时,autovacuum被彻底关闭,不会对任何表做清理。
    • autovacuum_max_workers > 0和autovacuum = off,只对系统表和开了delta表的列存表做清理(如vacuum delta表,vacuum cudesc表和delta merge)。
    • autovacuum_max_workers > 0和autovacuum = on,会对所有表做清理。
  • 8.1.3版本默认关闭对列存主表的清理,需要设置参数colvacuum_threshold_scale_factor来启用该功能。

autovacuum_naptime

参数说明:设置两次自动清理操作的时间间隔。

参数类型:SIGHUP

取值范围:整型,1~2147483 ,单位为秒(s)。

默认值:60s

autovacuum_vacuum_threshold

参数说明:设置触发VACUUM的阈值。当表上被删除或更新的记录数超过设定的阈值时才会对这个表执行VACUUM操作。

参数类型:SIGHUP

取值范围:整型,0~INT_MAX

默认值:50

autovacuum_analyze_threshold

参数说明:设置触发ANALYZE操作的阈值。当表上被删除、插入或更新的记录数超过设定的阈值时才会对这个表执行ANALYZE操作。

参数类型:SIGHUP

取值范围:整型,0~INT_MAX

默认值:

  • 若当前集群为低版本升级到8.1.3及以上集群版本,为保持和前向兼容,默认值为10000。
  • 若当前集群为新装的8.1.3及以上集群版本,默认值为50。

autovacuum_vacuum_scale_factor

参数说明:设置触发一个VACUUM时增加到autovacuum_vacuum_threshold的表大小的缩放系数。

参数类型:SIGHUP

取值范围:浮点型,0.0~100.0

默认值:0.2

autovacuum_analyze_scale_factor

参数说明:设置触发一个ANALYZE时增加到autovacuum_analyze_threshold的表大小的缩放系数。

参数类型:SIGHUP

取值范围:浮点型,0.0~100.0

默认值:

  • 若当前集群为低版本升级到8.1.3及以上集群版本,为保持和前向兼容,默认值为0.25。
  • 若当前集群为新装的8.1.3及以上集群版本,默认值为0.1。

autovacuum_freeze_max_age

参数说明:设置事务内的最大时间,使得表的pg_class.relfrozenxid字段在VACUUM操作执行之前被写入。

VACUUM也可以删除pg_clog/子目录中的旧文件;即使自动清理进程被禁止,系统也会调用自动清理进程来防止循环重复。

参数类型:SIGHUP

取值范围:整型,100 000~576 460 752 303 423 487

默认值:4000000000

autovacuum_vacuum_cost_delay

参数说明:设置在自动VACUUM操作里使用的开销延迟数值。

参数类型:SIGHUP

取值范围:整型,-1~100,单位为毫秒(ms)。其中-1表示使用常规的vacuum_cost_delay。

默认值:2ms

autovacuum_vacuum_cost_limit

参数说明:设置在自动VACUUM操作里使用的开销限制数值。

参数类型:SIGHUP

取值范围:整型,-1~10000。其中-1表示使用常规的vacuum_cost_limit。

默认值:-1