更新时间:2024-06-03 GMT+08:00

锁管理

GaussDB中,并发执行的事务由于竞争资源会导致死锁。本节介绍的参数主要管理事务锁的机制。

deadlock_timeout

参数说明:设置死锁超时检测时间。当申请的锁超过设定值时,系统会检查是否产生了死锁。该参数仅针对常规锁生效。

参数类型:整型

参数单位:毫秒(ms)

取值范围:1~2147483647

默认值:1s

设置方式:该参数属于SUSET类型参数,请参考表1中对应设置方法进行设置。

设置建议:

  • 死锁的检查代价是比较高的,服务器不会在每次等待锁的时候都运行这个过程。在系统运行过程中,不经常出现死锁情况,因此在检查死锁前只需等待一个相对较短的时间。deadlock_timeout增加,可以减少死锁检查浪费的时间,但是会减慢真正的死锁错误报告的速度。在负载过重的服务器上,用户可能需要增大deadlock_timeout。这个值的设置应该超过事务持续时间,这样可以减少在锁释放之前就开始死锁检查的问题。
  • 当设置log_lock_waits为on时,deadlock_timeout决定一个等待时间来将查询执行过程中的锁等待耗时信息写入日志。如果要研究锁延时情况,可以设置deadlock_timeout值比正常情况小。

lockwait_timeout

参数说明:控制单个锁的最长等待时间。当申请的锁等待时间超过设定值时,系统会报错。该参数仅针对常规锁生效。

参数类型:整型

参数单位:毫秒(ms)

取值范围:0 ~ 2147483647

默认值:20min

设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。例如,不带单位取值900,表示lockwait_timeout为900ms;带单位取值20min,表示lockwait_timeout为20min。取值如果要带单位,必须为ms、s、min、h、d。

设置建议:一般设置为默认值。根据业务需要,如果业务需要锁冲突超过多久,该参数就设置多少。

update_lockwait_timeout

参数说明:允许并发更新参数开启情况下,该参数控制并发更新同一行时单个锁的最长等待时间。当申请的锁等待时间超过设定值时,系统会报错。该参数仅针对常规锁生效。

参数类型:整型

参数单位:毫秒(ms)

取值范围:0 ~ 2147483647

默认值:2min(120000ms)

设置方式:该参数属于SUSET类型参数,请参考表1中对应设置方法进行设置。例如,不带单位取值900,表示update_lockwait_timeout为900ms;带单位取值2min,表示update_lockwait_timeout为2min。取值如果要带单位,必须为ms、s、min、h、d

设置建议:主要观测并发更新同一行的事务的workload。一般TP业务,执行时间较短小于两分钟,此时默认值误报概率较小;如果业务出现大量并发更新同一行事务,执行时间超过两分钟,可以调大该参数避免等锁超时误报。

max_locks_per_transaction

参数说明:控制每个事务能够得到对象锁的平均数量。

参数类型:整型

参数单位:

取值范围:10 ~ 2147483647

默认值:256

设置方式:该参数属于POSTMASTER类型参数,请参考表1中对应设置方法进行设置。

设置建议:

  • 共享锁的哈希表的大小是以假设任意时刻最多只有max_locks_per_transaction*(max_connections+max_prepared_transactions) 个独立的对象需要被锁住为基础进行计算的,进而推导出max_locks_per_transaction >= 业务事务的并发数 * 业务的每个事务加对象锁的数目/(max_connections+max_prepared_transactions) ,计算结果不超过参数取值范围的上限。
  • 不超过设定数量的多个对象可以在任意时刻同时被锁定。当在一个事务里面修改很多不同的表时,可能需要提高这个参数值。
  • 增大这个参数可能导致GaussDB请求更多的System V共享内存,有可能超过操作系统的缺省配置,导致数据库启动失败。
  • 当运行备机时,请将此参数设置不小于主机上的值,否则在备机上查询操作不被允许。

max_pred_locks_per_transaction

参数说明:控制每个事务允许断定锁的最大数量,是一个平均值。

  • 共享的断定锁表的大小是以假设任意时刻最多只有max_pred_locks_per_transaction*(max_connections+max_prepared_transactions) 个独立的对象需要被锁住为基础进行计算的。不超过设定数量的多个对象可以在任一时刻同时被锁定。当在一个事务里面修改很多不同的表时,可能需要提高这个默认数值。只能在服务器启动的时候设置。
  • 增大这个参数可能导致GaussDB请求更多的System V共享内存,有可能超过操作系统的缺省配置。

该参数属于POSTMASTER类型参数,请参考表1中对应设置方法进行设置。

取值范围:整型,10 ~ 2147483647‬

默认值:64

gs_clean_timeout

参数说明:控制Coordinator周期性调用gs_clean工具的时间,是一个平均值。

  • GaussDB数据库中事务处理使用的是两阶段提交的方法,当有两阶段事务残留时,该事务通常会拿着表级锁,导致其它连接无法加锁,此时需要调用gs_clean工具对集群中两阶段事务进行清理,gs_clean_timeout是控制Coordinator周期性调用gs_clean的时间。
  • 增大这个参数可能导致GaussDB周期性调用gs_clean工具的时间延长,导致两阶段事务清理时间延长。

该参数属于SIGHUP类型参数,请参考表1中对应设置方法进行设置。

取值范围:整型,0 ~ 2147483,单位为秒(s)。

默认值:1min

partition_lock_upgrade_timeout

参数说明:在执行某些查询语句的过程中,会需要将分区表上的锁级别由允许读的ExclusiveLock级别升级到读写阻塞的AccessExclusiveLock级别。如果此时已经存在并发的读事务,那么该锁升级操作将阻塞等待。partition_lock_upgrade_timeout为尝试锁升级的等待超时时间。

  • 在分区表上进行MERGE PARTITION和CLUSTER PARTITION操作时,都利用了临时表进行数据重排和文件交换,为了尽可能提高分区上的操作并发度,在数据重排阶段给相关分区加锁ExclusiveLock,在文件交换阶段加锁AccessExclusiveLock。
  • 常规加锁方式是等待加锁,直到加锁成功,或者等待时间超过lockwait_timeout发生超时失败。
  • 在分区表上进行MERGE PARTITION或CLUSTER PARTITION操作时,进入文件交换阶段需要申请加锁AccessExclusiveLock,加锁方式是尝试性加锁,加锁成功了则立即返回,不成功则等待50ms后继续下次尝试,加锁超时时间使用会话级设置参数partition_lock_upgrade_timeout。
  • 特殊值:若partition_lock_upgrade_timeout取值-1,表示无限等待,即不停的尝试锁升级,直到加锁成功。

    该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

取值范围:整型,最小值-1,最大值3000,单位为秒(s)。

默认值:1800

fault_mon_timeout

参数说明:轻量级死锁检测周期。该参数属于SIGHUP类型参数,请参考表1中对应设置方法进行设置。

取值范围:整型,最小值0,最大值1440,单位为分钟(min)

默认值:5min

enable_online_ddl_waitlock

参数说明:控制DDL是否会阻塞等待pg_advisory_lock/pgxc_lock_for_backup等集群锁。主要用于OM在线操作场景,不建议用户设置。

该参数属于SIGHUP类型参数,参考表1中对应设置方法进行设置。

取值范围:布尔型

  • on表示开启。
  • off表示关闭。

默认值:off

xloginsert_locks

参数说明:控制用于并发写预写式日志锁的个数。主要用于提高写预写式日志的效率。

参数类型:整型

参数单位:

取值范围:最小值1,最大值1000。若CPU为NUMA架构,数值必须为NUMA节点数量的整数倍。

默认值:16

设置方式:该参数属于POSTMASTER类型参数,参考表1中对应设置方法进行设置。

设置建议:ARM CPU架构在并发压力大的场景下,可能因为原子操作的竞争而导致概率性的性能抖动,可以适当降低该参数值而获取相对稳定的运行性能。

num_internal_lock_partitions

参数说明:控制内部轻量级锁分区的个数。主要用于各类场景的性能调优。内容以关键字和数字的KV方式组织,各个不同类型锁之间以逗号隔开。先后顺序对设置结果不影响,例如“CLOG_PART=256,CSNLOG_PART=512”等同于“CSNLOG_PART=512,CLOG_PART=256”。重复设置同一关键字时,以最后一次设置为准,例如“CLOG_PART=256,CLOG_PART=2”,设置的结果为CLOG_PART=2。当没有设置关键字时,则为默认值,各类锁的使用描述和最大、最小、默认值如下。

  • CLOG_PART:CLOG文件控制器的个数,增大该值可以提高CLOG日志写入效率,提升事务提交性能,但是会增大内存使用;减小该值会减少相应内存使用,但可能使得CLOG日志写入冲突变大,影响性能。最小值为1,最大值为256。
  • CSNLOG_PART:CSNLOG文件控制器的个数,增大该值可以提高CSNLOG日志写入效率,提升事务提交性能,但是会增大内存使用;减小该值会减少相应内存使用,但可能使得CSNLOG日志写入冲突变大,影响性能。最小值为1,最大值为512。
  • LOG2_LOCKTABLE_PART:常规锁表锁分区个数的2对数,增大该值可以提升正常流程常规锁获取锁的并行度,但是可能增加锁转移和锁消除时的耗时,对于等待事件在LockMgrLock时,可以调大该锁增加性能。最小值4,即锁分区数为16;最大值为16,即锁分区数为65536。
  • TWOPHASE_PART:两阶段事务锁的分区数,调大该值可以提高两阶段事务提交的并发数。最小值为1,最大值为64。
  • FASTPATH_PART:每个线程可以不通过主锁表拿锁的最大锁个数,对于分区表读取、更新、插入、删除操作且等待事件在LockMgrLock时,可以通过调大该值避免获取LockMgrLock提升性能,建议调整数量大于等于分区数*(1+本地索引数量)+全局索引数量+10,调大该值会额外增加内存。最小值为20,最大值为10000。

该参数属于POSTMASTER类型参数,参考表1中对应设置方法进行设置。

取值范围:字符串

默认值:

  • CLOG_PART:256
  • CSNLOG_PART:512
  • LOG2_LOCKTABLE_PART:4
  • TWOPHASE_PART:1
  • FASTPATH_PART:20

enable_wait_exclusive_lock

参数说明:控制ProcArrayLock的排他锁hang死检测与治愈功能的开关。

该参数属于SIGHUP类型参数,参考表1中对应设置方法进行设置。

取值范围:布尔型

  • on:表示开启。
  • off:表示关闭。

默认值:on

barrier_lock_timeout

参数说明:持有barrier锁的超时时间。

参数类型:整型

参数单位:秒(s)

取值范围:0~3600

默认值:30s

设置方式:该参数属于USERSET类型参数,请参考表1中对应设置方法进行设置。

设置建议:设置为默认值,不做调整。

enable_xid_abort_check

参数说明:事务提交时校验事务ID回滚开关是否开启。

参数类型:布尔型

参数单位:

取值范围:

  • on:表示开启。
  • off:表示关闭。

默认值:on

设置方式:该参数属于SIGHUP类型参数,请参考表1中对应设置方法进行设置。

设置建议:设置为默认值,不做调整。