修改TaurusDB代理的一致性级别
操作场景
使用TaurusDB 读写分离功能,会将SELECT分发至只读节点以降低主节点负载。TaurusDB主节点与只读节点共享底层存储,可以保证只读节点数据的最终一致性。但主节点的数据更新仍需通过redo日志同步到只读库,存在与写入压力相关的时延,因此在最终一致性下,无法保证分发至只读节点的SELECT能够获取到最新数据。
为解决SELECT无法获取最新数据问题,TaurusDB提供了三种一致性级别:最终一致性、会话一致性、全局一致性,满足您在不同业务场景下对一致性级别的要求。
云数据库 TaurusDB支持在创建数据库代理时设置一致性级别,具体请参见开通数据库代理。也支持数据库代理创建成功后修改一致性级别。
本章节主要介绍数据库代理创建成功后修改一致性级别的方法。
一致性级别介绍
- 功能介绍:
开启数据库代理后,同一会话内,连续多次SELECT请求会根据权重配比,路由到不同的数据库节点,由于主节点与读节点之前存在复制时延,并且各个读节点的复制时延大小不一定完全相同,可能会导致每次SELECT请求得到的结果存在差异,因此默认情况下,数据库代理只能保证数据的最终一致。
- 适用场景:
需要减轻主节点压力,让尽量多的读请求路由到只读节点,或您的业务读写比例为写多读少,您可以选择最终一致性。
- 功能介绍:
由于最终一致性可能会导致多次SELECT请求的结果存在差异,数据库代理进一步提供了会话级别的数据一致性,保证了在同一会话内,每次SELECT请求都可以获取到上一次写入操作后的最新数据。
数据库代理会记录每个数据节点的日志序号(Log Sequence Number,简称LSN),同时针对每一个会话也会维护对应的LSN,即Session LSN。当某个会话有数据更新操作执行完成时,数据库代理会根据当时主节点的LSN来更新对应的Session LSN,后续有读请求进来时,数据库代理会比较Session LSN以及各个数据节点的LSN,将请求发往LSN大于或等于Session LSN的数据节点,从而保证当前会话内,SELECT请求总能获取到上一次更新操作后的最新数据。
开启会话一致性后,如果主节点与读节点复制时延较大,各个读节点LSN均小于Session LSN,会导致SELECT请求发送到主节点,从而增大主节点的压力,整个数据库集群的读写性能会有一定的降低。
图1 会话一致性实现原理 - 适用场景:
TaurusDB的一致性级别越高,对主库的压力越大,集群性能也越低。若您的业务中存在同一会话内即写即查场景,您可以选择会话一致性。
- 功能介绍
会话一致性保证了同一个会话内,一定能够查询到读请求执行前已更新的数据,例如图2中读请求R(x1)依赖写请求W(x1, 4)的更新场景。但是在部分场景中,会话间也有依赖关系。例如图3中,Conn_2连接的R(x1)依赖Conn_1连接W(x1, 4)的更新数据,此时会话一致性无法保证查询结果的一致性,因此TaurusDB提供了全局一致性功能来解决该问题,保证在不同会话内,数据一致,即写入数据后,立即执行查询类操作,能够准确查到修改后的数据。
全局一致性的工作原理如下:
TaurusDB利用很短的复制延时和共享式分布式日志存储技术,在纯内核层面提供了RO节点强一致性读服务。在全局一致性功能开启之后,当某一个会话数据更新操作执行完成后,此时主节点的LSN会被更新为最新的LSN,后续读请求进来时,数据库代理会按照代理的路由模式直接路由到预期的节点上。由于存在主从复制延迟间隙,只读节点上当前LSN可能仍滞后于主节点。内核层面此时会立即加快只读节点的LSN推进,在毫秒级内完成只读节点和主节点的LSN同步。同步完成后,再对该读请求进行响应,保证读请求能够读到至请求发起时刻为止,任意一条已经完成更新的数据。
图4 全局一致性原理图如上图,当UPDATE语句下发到主机后,主机的LSN会从6推进到10,那么当下发到只读节点的第一个SELECT语句查询结果时,需要等备机的LSN从2推进到10后再返回最新结果;当下发到只读节点的第二个SELECT语句查询结果时,需要等备机的LSN从5推进到10后再返回最新结果。
- 适用场景
当主从延迟较高时,使用全局一致性可能会导致更多的请求被路由到主节点,造成主节点压力增大,业务延迟也可能增加。因此建议您在读多写少的场景下选择全局一致性。
- 参数配置
全局一致性提供以下两个配置参数:
表1 全局一致性参数说明 参数
说明
consistTimeout
全局一致性读超时时间,允许只读节点的LSN更新至主节点最新LSN的时间。
取值范围0-60000,默认值为20,单位为毫秒。
consistTimeoutPolicy
全局一致性读超时策略,若未能在参数consistTimeout设置的时间内将只读节点的LSN更新至主节点最新LSN,数据库代理将根据consistTimeoutPolicy参数设置进行对应操作。
取值范围:
- 1(默认):将读请求发送至主节点。
- 0:代理返回如下错误:
ERROR 7550: Query execution was interrupted, wait replication complete timeout,please retry
- 注意事项
- 全局一致性开通只对新连接生效、仅支持通过Proxy连接的场景。
- 全局一致性开关跟数据库代理实例绑定,在多个数据库代理实例场景下,可以根据不同业务的需要,按需提供全局一致性服务。
- 只读的数据库代理在开启全局一致性功能后,无法修改consistTimeoutPolicy参数,只会返回错误报文到客户端。
- 打开只读节点的查询缓存功能,将不支持全局一致性。
- 开启全局一致性,并选择默认consistTimeoutPolicy参数,如果主节点与读节点复制时延较大,会导致SELECT请求发送到主节点,从而增大主节点的压力,整个数据库集群的读写性能会有一定的降低。
- 开启全局一致性,读节点存在复制延迟,当读节点并发读压力大时,对应读节点上活跃连接数会升高、数据库实例读性能下降,建议客户将代理的路由模式配置为负载均衡,通过活跃连接数情况进行读请求分发,来充分发挥数据库实例的读性能。
- 开启全局一致性,若业务压力较大导致CPU满载,服务可能出现闪断的情况。
版本约束
- 会话一致性需要TaurusDB实例内核版本为2.0.54.1及以上,还需要数据库代理内核版本为2.7.4.0及以上。
- 全局一致性需要TaurusDB实例内核版本为2.0.57.240900及以上,还需要数据库代理内核版本为2.25.06.000及以上。
内核版本的查询方法请参见如何查看云数据库 TaurusDB实例的版本号。
使用须知
- 全局一致性功能当前是公测状态,如需使用,请提交工单。
- 修改一致性级别后,需要您在管理控制台上手动重启数据库代理或与数据库代理重新建立连接。重启数据库代理实例请参见重启TaurusDB代理。
操作步骤
- 登录管理控制台。
- 单击管理控制台左上角的
,选择区域和项目。
- 在页面左上角单击
,选择 。
- 在“实例管理”页面,选择目标实例,单击实例名称,进入实例概览页面。
- 在左侧导航栏,单击“数据库代理”,进入数据库代理页面。
- 单击目标代理实例名称,在“实例信息”模块的“一致性级别”处,单击“修改”。
图5 修改一致性级别
- 单击下拉箭头,选择对应的一致性级别。
图6 修改一致性级别
如果选择全局一致性,您还需要在TaurusDB实例的“参数修改”页面,将参数“innodb_rds_trx_use_commit_lsn”设置为“ON”。该参数为全局一致性的功能开关。
图7 打开全局一致性参数开关 - 单击“确定”,代理实例运行状态变为“修改一致性级别中”,此过程大概需要几分钟。
- 修改完成后,代理实例运行状态变为“正常”,您可查看到一致性级别已更新。