文档首页> 数据复制服务 DRS> 实时同步> 入云> 将MySQL同步到GaussDB(DWS)
更新时间:2024-05-10 GMT+08:00
分享

将MySQL同步到GaussDB(DWS)

支持的源和目标数据库

表1 支持的数据库

源数据库

目标数据库

  • 本地自建MySQL数据库
  • ECS自建MySQL数据库
  • 其他云上MySQL数据库
  • RDS for MySQL
  • GaussDB(DWS)集群 8.1.3、8.2.0版本

使用建议

  • DRS任务启动和全量数据同步阶段,请不要在源数据库执行DDL操作,否则可能导致任务异常。
  • 为保证同步前后数据一致性,确保同步期间目标数据库无业务写入。
  • 数据库同步与环境多样性和人为操作均有密切关系,为了确保同步的平顺,建议您在进行正式的数据库同步之前进行一次演练,可以帮助您提前发现问题并解决问题。
  • 基于以下原因,建议您在启动任务时选择“稍后启动”功能,将启动时间设置在业务低峰期,相对静止的数据可以有效提升一次性同步成功率,避免同步对业务造成性能影响。
    • 在网络无瓶颈的情况下,全量同步会对源数据库增加约50MB/s的查询压力,以及占用2~4个CPU。
    • 正在同步的数据被其他事务长时间锁死,可能导致读数据超时。
    • 由于MySQL固有特点限制,CPU资源紧张时,存储引擎为Tokudb的表,读取速度可能下降至10%。
    • DRS并发读取数据库,会占用大约6-10个session连接数,需要考虑该连接数对业务的影响。
    • 全量阶段读取表数据时,特别是大表的读取,可能会阻塞业务上对大表的独占锁操作。
    • 更多DRS对数据库的影响,可参考DRS对源数据库和目标数据库有什么影响
  • 数据对比

    建议您结合数据对比“稍后启动”功能,选择业务低峰期进行数据对比,以便得到更为具有参考性的对比结果。由于同步具有轻微的时差,在数据持续操作过程中进行对比任务,可能会出现少量数据不一致对比结果,从而失去参考意义。

使用须知

在创建同步任务前,请务必阅读以下使用须知。

  • 建议创建单独用于DRS任务连接的数据库账号,避免因为数据库账号密码修改,导致的任务连接失败。
  • 连接源和目标数据库的账号密码修改后,请尽快修改DRS任务中的连接信息,避免任务连接失败后自动重试,导致数据库账号被锁定影响使用。
表2 使用须知

类型名称

使用和操作限制

数据库权限设置

  • 源数据库账号需要具备如下权限:SELECT、LOCK TABLES、REPLICATION SLAVE、REPLICATION CLIENT。
  • 目标数据库账号必须具有每张表的如下权限:INSERT、SELECT、UPDATE、DELETE、CONNECT、CREATE。

同步对象约束

  • 支持表、普通索引(B-Tree索引)、约束(主键、空、非空)的同步,不支持视图、外键、存储过程、触发器、函数、事件、虚拟列、唯一约束、唯一索引的同步。
  • 全量同步支持comment,增量不支持。
  • 不支持的数据类型有:xml、geometry、point、lineString、polygon、geometrycollection、multipoint、multilinestring、multipolygon。
  • 仅支持MyISAM和InnoDB表的同步。
  • 不支持同步既是无主键表,又是分区表的自建表,可能会导致任务失败。
  • 对象名同步到目标库后会转换成小写,因此选择的源库表中不能存在表名称字母相同但大小写不同的表,否则,会导致同步失败。
  • 同步对象中如果存在包含longtext、longblob类型字段的表,建议创建大规格及以上规格的DRS任务进行同步,否则可能会导致capture OOM。
  • 同步对象列名不能为CTID、XMIN、CMIN、XMAX、CMAX、TABLEOID、XC_NODE_ID、TID等GaussDB(DWS)禁止的字段,否则会导致任务失败。
  • 全量和增量同步不支持隐藏列(INVISIBLE),隐藏列是MySQL 8.0.23开始支持的特性,例如:
    CREATE TABLE `test11` (
      `id` int NOT NULL,
      `c1` int DEFAULT NULL /*!80023 INVISIBLE */,
      PRIMARY KEY (`id`));

源数据库要求

  • 增量同步时,MySQL源数据库的binlog日志必须打开,且binlog日志格式必须为Row格式。
  • 增量同步时,如果设置session变量character_set_client为binary,可能导致乱码。
  • 在磁盘空间允许的情况下,建议源数据库binlog保存时间越长越好,建议为3天。设置为0,可能会导致同步失败。
    • 源数据库为自建MySQL时,通过设置expire_logs_days参数设置binlog保留时间。建议将expire_logs_day参数设置在合理的范围,确保恢复时断点处的binlog尚未过期,以保证任务中断后的顺利恢复。
    • 源数据库为RDS for MySQL时,设置binlog保留时间可参考《RDS用户指南》
  • 源数据库GTID状态必须为开启状态,源数据库实例没有开启GTID的情况下不支持主备倒换,DRS任务会因为位点不续接而中断导致无法恢复。
  • 必须设置MySQL源数据库的server-id,server-id的取值范围在2-4294967296之间。
  • 源数据库中的库名、表名不能包含:.<'>`/\"以及非ASCII字符。

目标数据库要求

  • 目标数据库实例的运行状态必须正常。
  • 目标数据库实例必须有足够的磁盘空间。
  • 目标数据库的时区设置必须与源数据库一致。如果时区设置不一致,同步后会导致涉及时间数据类型的值显示不一致,修改为统一时区后数据显示一致。

操作须知

  • 若专属计算集群不支持4vCPU/8G或以上规格实例,则无法创建同步任务。
  • 相互关联的数据对象要确保同时同步,避免因关联对象缺失,导致同步失败。常见的关联关系:索引引用表等。
  • 不支持外键级联操作。当外键是普通索引的时候,可能会导致表结构创建失败,建议改成唯一索引。
  • 不支持源数据库进行恢复操作。
  • 不支持强制清理binlog,否则会导致同步任务失败。
  • 源数据库不支持reset master或reset master to命令,可能会导致DRS任务失败或者数据不一致。
  • 同步无主键表时,如果存在唯一键,可能因数据冲突导致写入失败。
  • 不建议在数据库中使用非精确数值类型做主键,该特性影响 DRS 增量场景下对 UPDATE、DELETE语句的同步,导致任务失败。
  • 如果无主键表中包含大字段(blob、text、clob、nclob、bytea),增量同步阶段存在大字段数据不一致的可能性。
  • 源库为RDS for MySQL实例时,不支持带有TDE特性并建立具有加密功能表。
  • 源库为RDS for MySQL实例时,支持源端多张表对GaussDB(DWS)一张表的映射。详细操作可参考创建MySQL到GaussDB(DWS)同步任务
  • 如果源库MySQL不支持TLS1.2协议,或者为版本较低的自建库(低于5.6.46或在5.7.0-5.7.28之间),需提交运维申请才能使用SSL测试连接。
  • 在创建DRS任务之前,如果源数据库实例开启并设置了SQL限流规则,可能会导致DRS任务失败。
  • MySQL 5.7版会过滤check约束,如果源数据库为5.7版时,不建议使用check约束,可能会导致数据不一致。
  • 网络中断在30秒内恢复的,不影响实时同步,如果超过30秒,则会导致同步任务失败。
  • MySQL的唯一约束(unique key)在同步到目标GaussDB(DWS)后会改写成普通约束,主键(primary key)的同步保持不变。
  • 目标数据库与源数据库字符集不一致可能会导致同步后数据不一致或者同步失败。
  • 数据类型不兼容时,可能引起同步失败。
  • 支持目标数据库中的表比源数据库多列场景,但是需要避免以下场景可能导致的任务失败。
    • 目标端多的列要求非空且没有默认值,源端insert数据,同步到目标端后多的列为null,不符合目标端要求。
    • 目标端多的列设置固定默认值,且有唯一约束。源端insert多条数据后,同步到目标端后多的列为固定默认值,不符合目标端要求。
  • 实时同步过程中,若源库为RDS时,支持修改端口,修改之后同步任务失败,需要通过重试后继续进行同步。
  • 实时同步过程中,若源库为非RDS时,不支持修改端口。
  • 实时同步过程中,不支持IP、账号、密码修改。
  • 在MySQL中,同一个database(schema)下面的不同表可以存在相同的索引名或约束名。而目标端GaussDB(DWS)中,同一个schema中索引和约束名是唯一的,且长度存在上限。为防止索引和约束名冲突,DRS同步到目标表上的索引名称将变为此格式:哈希值+原索引名(可能被截断)+_key。其中哈希值由“原库名_原表名_原索引名”计算得到。同理,表上的原约束名将变为:哈希值+原约束名(可能被截断)+_key,或表名_原索引名。
  • 全量阶段基于索引实现上差异,只保留普通B-Tree索引,其他索引默认不同步。GaussDB(DWS)索引过多时会影响存储空间和入库性能,建议用户可根据业务需求按需建索引。
  • DRS全量同步表结构时,源库中char、varchar、nvarchar、enum、set字符类型长度在目标库会按照字节长自动扩大(因为目标库为字节长)。
  • 全量同步分区表的结构时会将该对象转为非分区的普通表,增量同步时,源库跟分区表相关的操作,可能无法同步到目标库或者在目标库执行失败。增量阶段同步分区表会依赖GaussDB(DWS)支持的类型创建分区表,可能会创建失败。
  • 全量同步timestamp类型时,默认值中的on update current_timestamp语法将不会同步到目标库GaussDB(DWS)中。
  • 增量同步过程中支持DDL操作。
    • 一对一的场景下,默认同步的DDL类型有CREATE_TABLE,RENAME_TABLE,ADD_COLUMN,MODIFY_COLUMN,ALTER_COLUMN,DROP_CONSTRAINT、ADD_CONSTRAINT、CREATE_INDEX,DROP_INDEX,RENAME_INDEX,RENAME_COLUMN,客户可以根据自身需求,在对象选择页面选择需要同步的DDL类型。
    • 多对一场景下,执行colunm重命名操作,必须停业务操作,不然会有数据不一致的风险。
    • 多对一场景下,推荐只同步加列DDL,其他的DDL同步可能会因为目标表被修改而导致任务失败或数据不一致。
    • 多对一场景下,执行ADD_COLUNM时,需保证每张表加列的类型一致,否则有可能导致任务失败。
    • 新增和修改表名、列名、索引名时不能超出63字符,否则任务会失败。
    • 执行DDL语句创建索引时,语句中表名+索引名超出63字符可能出现重名情况,造成索引创建失败。
    • 源库无主键表增加主键的时候,必须含有第一列,否则任务会失败。
    • 增量阶段执行DDL操作时,如果目标表不存在,则该DDL会被忽略掉。
    • 增量阶段,源数据库执行CHANGE COLUMN修改列信息,如果该列在目标数据库GaussDB(DWS)中为分布列,则该语句会被忽略,因为GaussDB(DWS)不支持修改分布列。
    • 增量阶段,由于源和目标数据库索引规则不一样,所以不支持RENAME INDEX的DDL操作。
    • 增量阶段,不建议CHAR(0)与其他字符拼接进行同步,例如插入CONCAT('a',CHAR(0),'b'),可能造成数据不一致。
    • 增量阶段,JSON数据类型里不建议CHAR(34)(双引号)、CHAR(92)(反斜杠)与其他字符拼接进行同步,例如插入JSON_OBJECT('$.0', CONCAT('a', CHAR(34), 'b')),同步到目标端后会多出一个反斜杠,造成数据不一致。
  • 增量同步DDL中的SQL来源于用户执行的原生SQL,全量同步的表结构语法是经过SQL语法层处理之后的SQL语句,两者之前存在一些类型或者约束差异,可能会导致全量和增量创建的结构或者字段类型不同,详细说明可参考同步到GaussDB(DWS)的使用建议
  • 增量同步过程中,不支持指定位置加列的DDL操作(例如ALTER TABLE ddl_test ADD COLUMN c2 AFTER/FIRST c1;),DRS会删除AFTER/FIRST属性,可能会导致列顺序不一致。
  • 增量同步过程中,库级同步不支持Online DDL,表级同步目前只支持阿里云DMS产生的Online DDL。
  • 增量同步过程中,库级同步新建的无主键表必须包含以下列中的其中之一,详细说明可参考GaussDB(DWS)参数说明

    INTEGER TYPES: TINYINT、SMALLINT、INT、BIGINT、NUMERIC/DECIMAL;

    CHARACTER TYPES: CHAR、BPCHAR、VARCHAR、VARCHAR2、NVARCHAR2;

    DATE/TIME TYPES: DATE、TIME、TIMETZ、TIMESTAMP、TIMESTAMPTZ、INTERVAL、SMALLDATETIME;

    无主键表会指定可作为分布列的其中一列作为分布列,如果所有列类型都无法作为分布列,会导致建表失败,DRS同步中断。

  • 增量同步过程中,不支持delete和update目标端主键类型为binary,text,blob,clob的表。
  • 库级同步,在增量同步过程中,不能在源库创建名称字母相同但大小写不同的表,否则会导致其中一张表无法同步。
  • 建议将expire_log_day参数设置在合理的范围,确保恢复时断点处的binlog尚未过期,以保证服务中断后的顺利恢复。
  • 源端同步的表如果有AUTO_INCREMENT属性,结束任务时,DRS会自动刷新同步表的序列整型列所对应的GaussDB(DWS)自增列(sequence)起始值,刷新值为该列的最大值+10000。

操作步骤

本小节以RDS for MySQL到GaussDB(DWS)多对一场景的实时同步为示例,介绍如何使用数据复制服务配置实时同步任务。

  1. 在“实时同步管理”页面,单击“创建同步任务”。
  2. 在“同步实例”页面,填选区域、项目、任务名称、描述、同步实例信息,单击“开始创建”

    • 任务信息
      图1 同步任务信息
      表3 任务和描述

      参数

      描述

      区域

      当前所在区域,可进行切换。

      项目

      当前区域对应的项目,可进行切换。

      任务名称

      任务名称在4到50位之间,必须以字母开头,可以包含字母、数字、中划线或下划线,不能包含其他的特殊字符。

      描述

      描述不能超过256位,且不能包含! = < > & ' " \ 特殊字符。

    • 同步实例信息
      图2 同步实例信息

      表4 同步实例信息

      参数

      描述

      数据流动方向

      选择“入云”

      源数据库引擎

      选择“MySQL”

      目标数据库引擎

      选择“GaussDB(DWS)”

      网络类型

      此处以“VPC网络”为示例。目前支持可选“公网网络”“VPC网络”“VPN、专线网络”

      • VPC网络:适合云上同账号同Region数据库之间的同步。
      • 公网网络:适合通过公网网络把其他云下或其他平台的数据库同步到目标数据库,该类型要求数据库绑定弹性公网IP(EIP)。
      • VPN、专线网络:适合通过专线网络,实现其他云下自建数据库与云上数据库同步、云上同Region跨账号、或云上跨Region的数据库之间的同步。

      DRS任务类型

      选择DRS任务类型,可选“单AZ”和“双AZ”。

      • 双AZ:一主一备的经典高可用架构,提高了DRS任务的可靠性。双AZ任务创建后,DRS会同时创建一主一备两个子任务,当主AZ任务发生异常,DRS会自动启动备AZ任务继续进行同步,提高同步任务的可靠性。适用于业务数据量较大,需要长期同步,并对中断时间有严格要求的场景。
      • 单AZ:采用单个节点部署架构,每个任务只创建一个节点,性价比较高。适用于业务数据量较小,短期同步,并对中断时间无严格要求的场景。

      目前仅部分链路支持DRS任务类型的选择,详细说明可参考双AZ任务倒换

      目标数据库实例

      可用的GaussDB(DWS)实例。

      同步实例所在子网

      请选择同步实例所在的子网。也可以单击“查看子网”,跳转至“网络控制台”查看实例所在子网帮助选择。

      默认值为当前所选数据库实例所在子网,请选择有可用IP地址的子网。为确保同步实例创建成功,仅显示已经开启DHCP的子网。

      同步模式

      DRS任务支持的同步模式,此处以“全量+增量”为示例。DRS全量、增量底层实现原理可参考产品架构和功能原理

      • 全量+增量

        该模式为数据持续性实时同步,通过全量过程完成目标端数据库的初始化后,增量同步阶段通过解析日志等技术,将源端和目标端数据保持数据持续一致。

        说明:

        选择“全量+增量”同步模式,增量同步可以在全量同步完成的基础上实现数据的持续同步,无需中断业务,实现同步过程中源业务和数据库继续对外提供访问。

      • 全量

        该模式为数据库一次性同步,适用于可中断业务的数据库同步场景,全量同步将用户选择的数据库对象和数据一次性同步至目标端数据库。

      • 增量

        该模式通过解析日志等技术,将源端产生的增量数据持续同步至目标端数据库。

      指定公网IP

      网络类型选择“公网网络”时可见,选择为DRS实例绑定的弹性公网IP。任务创建时,DRS将会自动绑定该弹性公网IP,等待任务结束后将自动解绑该弹性公网IP。

      公网网络迁移产生的数据传输费用收取标准请参见:弹性公网IP价格计算器

    • 任务类型
      图3 任务类型
      表5 任务类型信息

      参数

      描述

      规格类型

      选择DRS实例的规格类型,不同规格类型对应不同性能的性能上限,详细可参考实时同步链路规格说明

      说明:

      目前,DRS同步仅支持任务类型为单AZ的同步任务升级实例规格,不支持降低规格,具体操作及约束限制可参考同步规格变更

      可用区

      DRS任务创建的可用区,选择跟源或目标库相同的可用区性能更优。

      DRS任务类型选择“双AZ”时,可用区分为“主可用区”和“备可用区”。

      图4 可用区
    • 企业项目和标签
      图5 企业项目和标签
      表6 企业项目和标签

      参数

      描述

      企业项目

      企业项目是一种云资源管理方式,企业项目管理服务提供统一的云资源按项目管理,以及项目内的资源管理、成员管理。请在下拉框中选择所在的企业项目,其中,default为默认项目。

      更多关于企业项目的信息,请参见《企业管理用户指南》

      如果需要自定义企业项目,请在控制台右上角单击“企业”,进入“企业项目管理”页面创建,具体请参见《企业管理用户指南》中“创建企业项目”的内容。

      标签

      • 可选配置,对同步任务的标识。使用标签可方便管理您的任务。每个任务最多支持20个标签配额。
      • 如果您的组织已经设定DRS的相关标签策略,则需按照标签策略规则为任务添加标签。标签如果不符合标签策略的规则,则可能会导致任务创建失败,请联系组织管理员了解标签策略详情。
      • 任务创建成功后,您可以单击任务名称,在“标签”页签下查看对应标签。关于标签的详细操作,请参见标签管理

    对于创建失败的任务,DRS默认保留3天,超过3天将会自动结束任务。

  3. 在“源库及目标库”页面,同步实例创建成功后,填选源库信息和目标库信息,单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通后,勾选协议,单击“下一步”

    图6 源库信息
    表7 源库信息

    参数

    描述

    数据库类型

    源数据库类型,可选“自建库”和“RDS实例”,此处以“RDS实例”为示例。

    数据库实例名称

    选择待同步的RDS实例。

    数据库用户名

    源数据库的用户名。

    数据库密码

    源数据库的用户名所对应的密码。

    源数据库的数据库用户名和密码,会被系统加密暂存,直至删除该任务后自动清除。

    图7 目标库信息
    表8 目标库信息

    参数

    描述

    数据库实例名称

    默认为创建同步任务时选择的GaussDB(DWS)实例,不可进行修改。

    数据库用户名

    目标数据库对应的数据库用户名。

    数据库密码

    数据库用户名和密码将被系统加密暂存,直至该任务删除后清除。

  4. “设置同步”页面,选择同步对象类型和同步对象。单击“下一步”

    图8 同步模式

    表9 同步模式和对象

    参数

    描述

    流速模式

    流速模式支持限速和不限速,默认为不限速。限速模式只对全量阶段生效,增量阶段不生效。

    • 限速

      自定义的最大同步速度,全量同步过程中的同步速度将不会超过该速度。

      当流速模式选择了“限速”时,你需要通过流速设置来定时控制同步速度。流速设置通常包括限速时间段和流速大小的设置。默认的限速时间段为“全天限流”,您也可以根据业务需求选择“时段限流”。自定义的时段限流支持最多设置3个定时任务,每个定时任务之间不能存在交叉的时间段,未设定在限速时间段的时间默认为不限速。

      流速的大小需要根据业务场景来设置,不能超过9999MB/s。

      图9 设置流速模式
    • 不限速
      对同步速度不进行限制,通常会最大化使用源数据库的出口带宽。该流速模式同时会对源数据库造成读消耗,消耗取决于源数据库的出口带宽。比如源数据库的出口带宽为100MB/s,假设高速模式使用了80%带宽,则同步对源数据库将造成80MB/s的读操作IO消耗。
      说明:
      • 限速模式只对全量阶段生效,增量阶段不生效。
      • 您也可以在创建任务后修改流速模式。具体方法请参见修改流速模式

    全量同步对象类型

    全量同步对象类型,可选同步表结构、同步数据、同步索引,根据实际需求进行选择要同步内容。

    • 同步数据为必选项。
    • 选择同步表结构的时候目标库不能有同名的表。
    • 不选同步表结构的时候目标库必须有相应的表,且要保证表结构与所选表结构相同。

    由于GaussDB(DWS)的表结构具有业务逻辑,建议结合业务情况在GaussDB(DWS)专家指导下自建表结构,并确保表名、列名、列类型的准确性,否则会出现数据同步失败、数据同步精度丢失等情况。

    增量阶段冲突策略

    该冲突策略特指增量同步中的冲突处理策略,全量阶段的冲突默认忽略。冲突策略目前支持如下形式:

    • 忽略

      当同步数据与目标数据库已有数据冲突时(主键/唯一键存在重复等),将跳过冲突数据,继续进行后续同步。选择忽略可能导致源库与目标库数据不一致。

    • 报错

      当同步数据与目标数据库已有数据冲突时(主键/唯一键存在重复等),同步任务将失败并立即中止。

    • 覆盖

      当同步数据与目标数据库已有数据冲突时(主键/唯一键存在重复等),将覆盖原来的冲突数据。

    异常数据策略

    源和目标数据库的客观差异差异,可能导致部分数据无法写入成功,出现异常数据,请选择出现异常数据时的任务策略。

    • 任务继续:不因少量异常数据导致全部数据均停止同步,异常数据发生时将会自动记录脏数据,可在“异常数据”模块查看这部分数据。
    • 任务失败:出现异常数据后,任务失败停止。

    DML同步

    选择需要同步的DML操作,默认都勾选。

    不勾选Delete则不会同步源库增量数据中的Delete语句,可能会导致数据不一致,因此存在数据冲突或任务失败的风险。

    启动位点

    步骤2的同步模式选择“增量”时可见,增量同步的启动位点,任务的源库日志从位点后开始获取(不含当前启动位点)。

    通过show master status命令获取源库位点,根据提示分别填写File、Position、Executed_Gtid_Set。

    数据同步拓扑

    数据同步功能支持多种同步拓扑,您可以根据业务需求规划您的同步实例。数据同步拓扑说明可参考数据同步拓扑介绍

    说明:

    “数据同步拓扑”选择目前仅支持白名单用户,需要提交工单申请才能使用。您可以在管理控制台右上角,选择“工单 > 新建工单”,完成工单提交。

    增量支持DDL

    选择增量同步的DDL类型,用户根据需求可选择“默认值”“自定义”

    • “默认值”
      • 库级同步情况下,Binlog中权限类DDL除外,所有库内对象相关DDL将会同步至目标,常见的DDL有CREATE_TABLE,RENAME_TABLE等。
      • 表级同步情况下,已选定的同步表相关在Binlog中DDL将全部同步,与同步表无关的对象DDL将不同步。常见的DDL有ADD_COLUMN,MODIFY_COLUMN,ALTER_COLUMN等。
    • “自定义”:用户根据需求,选择需要同步的DDL类型,不同链路支持的DDL类型以界面显示为准。
    说明:
    • “增量支持DDL”功能目前仅支持白名单用户,需要提交工单申请才能使用。您可以在管理控制台右上角,选择“工单 > 新建工单”,完成工单提交。
    • 一对一、一对多场景:如果业务上认为源和目标应该使用保持严格一致,那么高危类DDL也应该勾选并同步。如果业务上确定某个高危DDL不应该发生,则可以不勾选同步高危类DDL,这样DRS将拦截过滤这个DDL,从而起到保护目标数据的作用。但需要知晓,过滤DDL的附带问题是可能导致同步失败,例如过滤删列动作。
    • 多对一数据聚合场景:最佳方式是推荐只选择同步加列DDL,其他大部分DDL同步都可能因目标表修改而导致数据不一致或多对一中其他任务失败的情况发生。

    同步对象

    左侧框是源数据库对象,右侧框是已经选择的对象,可选表级同步、库级同步、导入对象文件,您可以根据业务场景选择对应的数据进行同步。

    • 如果同步的对象在源数据库和目标数据库中的命名不同,可在右侧已选对象框中修改目标库对象映射名称。也可通过对象名映射功能实现多张表对一张表的同步,具体操作可参考对象名修改(对象名映射)
      • 使用多对一操作时,需要使用数据加工的附加列操作来避免数据冲突。
      • 多对一场景下,选择表级同步时,如果要对已保存的库映射名称进行修改,需展开库进行操作。
      • 源库和目标库多对一的表的结构要一致。
    • 选择“导入对象文件”,具体步骤和说明可参考导入同步对象。文件导入对象也支持多张表对一张表的映射,由于消息体限制最多导入10000个表(表名长度过长或者规则过长也会影响导入数量)。
    说明:
    • 选择数据的时候支持对展开的库搜索,以便您快速选择需要的数据库对象。
    • 如果有切换源数据库的操作或源库同步对象变化的情况,请在选择同步对象前单击右上角的,以确保待选择的对象为最新源数据库对象。
    • 对象名同步到目标库后会转换成小写,因此选择的源库表中不能存在表名称字母相同但大小写不同的表,否则,会导致同步失败。
    • 当对象名称包含空格时,名称前后的空格不显示,中间如有多个空格只显示一个空格。
    • 选择的同步对象名称中不能包含空格。
    • 选择库级同步时,在增量同步过程中,不能在源库创建名称字母相同但大小写不同的表,否则会导致其中一张表无法同步。

  5. “数据加工”页面,可对需要加工的表对象进行数据过滤或添加附加列,,单击“下一步”

    • 如果需要设置数据过滤,选择“数据过滤”,设置相关过滤规则。
    • 如果需要设置添加附加列,选择“附加列”,单击“操作”列的“添加”,选填需要添加的列名和操作类型信息。

      相关操作可参考数据加工

    图10 数据加工

  6. “预检查”页面,进行同步任务预校验,校验是否可进行实时同步。

    • 查看检查结果,如有不通过的检查项,需要修复不通过项后,单击“重新校验”按钮重新进行任务预校验。

      预检查不通过项处理建议请参见《数据复制服务用户指南》中的“预检查不通过项修复方法”。

    • 预检查完成后,且所有检查项结果均通过时,单击“下一步”
      图11 预检查

      所有检查项结果均通过时,若存在请确认项,需要阅读并确认详情后才可以继续执行下一步操作。

  7. “任务确认”页面,设置同步任务的启动时间、任务异常通知设置、SMN主题、时延阈值、任务异常自动结束时间,并确认同步任务信息无误后,勾选协议,单击“启动任务”,提交同步任务。

    图12 任务启动设置
    表10 任务启动设置

    参数

    描述

    启动时间

    同步任务的启动时间可以根据业务需求,设置为“立即启动”或“稍后启动”。

    说明:

    预计同步任务启动后,会对源数据库和目标数据库的性能产生影响,建议选择业务低峰期,合理设置同步任务的启动时间。

    任务异常通知设置

    该项为可选参数,开启之后,选择对应的SMN主题。当同步任务状态、时延指标或数据异常时,系统将发送通知。

    SMN主题

    “任务异常通知设置”项开启后可见,需提前在SMN上申请主题并添加订阅。

    SMN主题申请和订阅可参考《消息通知服务用户指南》

    时延阈值

    在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一个时间差,称为时延,单位为秒。

    时延阈值设置是指时延超过一定的值后(时延阈值范围为0到3600s),DRS可以发送告警通知。告警通知将在时延稳定超过设定的阈值6min后发送,避免出现由于时延波动反复发送告警通知的情况。

    说明:
    • 当时延阈值设置为0时,不会发送通知给收件人。
    • 首次进入增量同步阶段,会有较多数据等待同步,存在较大的时延,属于正常情况,不在此功能的监控范围之内。
    • 设置时延阈值之前,需要设置任务异常通知。

    数据异常通知

    该项为可选参数,开启之后,当同步任务数据异常时,系统将发送通知。

    任务异常自动结束时间(天)

    设置任务异常自动结束天数,输入值必须在14到100之间,默认值14。

    说明:
    • 仅按需计费任务支持设置任务异常自动结束时间,包年/包月任务不支持。
    • 异常状态下的任务仍然会计费,而长时间异常的任务无法续传和恢复。设置任务异常自动结束天数后,异常且超时的任务将会自动结束,以免产生不必要的费用。

  8. 同步任务提交后,您可在“实时同步管理”页面,查看并管理自己的任务

    • 您可查看任务提交后的状态,状态请参见任务状态说明
    • 在任务列表的右上角,单击刷新列表,可查看到最新的任务状态。
    • 对于未启动、状态为配置中的任务,DRS默认保留3天,超过3天DRS会自动删除后台资源,当前任务状态不变。当用户再次配置时,DRS会重新申请资源,此时DRS任务IP会发生改变。

分享:

    相关文档

    相关产品