更新时间:2022-05-20 GMT+08:00
分享

将Oracle同步到DDM

支持的源和目标数据库

表1 支持的数据库

源数据库

目标数据库

  • 本地自建数据库
  • ECS自建数据库
  • DDM实例

前提条件

  • 已登录数据复制服务控制台。
  • 账户余额大于等于0元。
  • 满足实时同步支持的数据库类型和版本,详情请参见支持的数据库
  • 当用户创建DRS任务使用的是子帐号时,请先确认已添加过委托。创建委托方法,可参考委托管理

使用建议

  • DRS任务启动和全量数据同步阶段,请不要在源数据库执行DDL操作,否则可能导致任务异常。
  • 为保证同步前后数据一致性,确保同步期间目标数据库无业务写入。
  • 数据库同步与环境多样性和人为操作均有密切关系,为了确保同步的平顺,建议您在进行正式的数据库同步之前进行一次演练,可以帮助您提前发现问题并解决问题。
  • 基于以下原因,建议您在启动任务时选择“稍后启动”功能,将启动时间设置在业务低峰期,相对静止的数据可以有效提升一次性同步成功率,避免同步对业务造成性能影响。
    • 在网络无瓶颈的情况下,全量同步会对源数据库增加约50MB/s的查询压力,以及占用2~4个CPU。
    • 同步无主键表时,为了确保数据一致性,会存在3s以内的单表级锁定。
    • 正在同步的数据被其他事务长时间锁死,可能导致读数据超时。
    • DRS并发读取数据库,会占用大约6-10个session连接数,需要考虑该连接数对业务的影响。
    • 全量阶段读取表数据时,特别是大表的读取,可能会阻塞业务上对大表的独占锁操作。
    • 更多DRS对数据库的影响,可参考DRS对源数据库和目标数据库有什么影响
  • 数据对比

    建议您结合数据对比的“稍后启动”功能,选择业务低峰期进行数据对比,以便得到更为具有参考性的对比结果。由于同步具有轻微的时差,在数据持续操作过程中进行对比任务,可能会出现少量数据不一致对比结果,从而失去参考意义。

使用须知

在创建同步任务前,请务必阅读以下使用须知。

表2 使用须知

类型名称

使用和操作限制

数据库权限设置

  • 源数据库端:
    • 全量同步:需要具有CREATE SESSION,SELECT ANY DICTIONARY,针对单表的SELECT权限(GRANT SELECT <userName.tbName> to drsUser;)权限。
    • 全量+增量同步:

      12c及以上版本CDB数据库同步时,需要具有CREATE SESSION,SELECT ANY DICTIONARY,针对单表的SELECT权限(GRANT SELECT <userName.tbName> to drsUser;),EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION,LOGMINING,SELECT ON SYS.COL$,SELECT ON SYS.OBJ$,SET CONTAINER(GRANT SET CONTAINER TO <userName> CONTAINER=ALL;)权限。

      12c及以上版本PDB数据库同步时,除了需要具有CREATE SESSION,SELECT ANY DICTIONARY,针对单表的SELECT权限(GRANT SELECT <userName.tbName> to drsUser;),EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION,LOGMINING,SELECT ON SYS.COL$,SELECT ON SYS.OBJ$权限,还需要具有CDB的CREATE SESSION,SELECT ANY DICTIONARYCREATE SESSION, SELECT ANY DICTIONARY,EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION,LOGMINING,SET CONTAINER(GRANT SET CONTAINER TO <userName> CONTAINER=ALL;)权限。

      11g及以下版本数据库同步时,需要具有CREATE SESSION,SELECT ANY DICTIONARY,针对单表的SELECT权限(GRANT SELECT <userName.tbName> to drsUser;),EXECUTE_CATALOG_ROLE,SELECT ANY TRANSACTION,SELECT ON SYS.COL$,SELECT ON SYS.OBJ$。

  • 目标数据库端:提供的目标数据库账号必须拥有如下权限:SELECT、CREATE、DROP、DELETE、INSERT、UPDATE、ALTER、INDEX、EVENT、RELOAD、CREATE VIEW。

同步对象约束

  • 增量同步不支持DDL的同步。
  • 全量阶段不支持bfile,xml、sdo_geometry、urowid和自定义类型。
  • 增量阶段不支持bfile,xml、interval、sdo_geometry、urowid和自定义类型。
  • 目前只支持同步源库的数据,不支持同步源库表结构及其他数据库对象。
  • 用户需要在目标库根据源端逻辑库的表结构,自行在目标库创建对应的表结构及索引。未在目标库创建的对象,视为用户不选择这个对象进行同步。
  • 同步时需要在目标库创建表结构,目标库表结构要包含源库所有列,且主键要一致。
  • 源库支持to_date和sys_guid函数做默认值。将其他函数作为default值时,需要目标库也有相同功能的函数。对于目标库不存在对应函数的情况,可能会出现以下结果:
    • 默认值函数可能会被置空。
    • 创建表失败,导致对象对比不一致或者任务失败。
  • 如果表中只有LOB字段,可能出现数据不一致性情况。
  • 不支持默认值含有表达式的函数的表的同步。
  • 不支持同步源库中的临时表。

源数据库要求

  • Oracle单行记录不能超过8KB(text、blob部分计算),原因是MySQL innoDB引擎限制单行大小不能超过8KB。
  • 不建议以字符串类型作为主键或唯一键,因为Oracle的字符串作为主键、唯一键时区分空格,而MySQL不区分,可能导致数据不一致和死锁问题。
  • binary_float或者binary_double类型不支持设置Nan、Inf、-Inf三个值,因为MySQL不支持
  • Oracle中建议列名不要取名AUTO_PK_ROW_ID,原因是这个列名在MySQL5.7中是保留列名,无法创建出来。
  • Oracle中number(p, s)字段的精度不要超过p: [1, 38], s:[p-65, min(p, 30)]的精度表示范围。其中,s取值依赖于p的取值变化,即下限为p-65, 上限为p或30中取最小值。例如:当p=1, s的取值范围是[-64, 1]。当p=38, s取值范围是[-27, 30]。

    int字段的值不要超过(65,0)的精度表示范围。原因是MySQL数字的表示范围比Oracle小。

  • 不支持表名包含除下划线外的其他特殊字符的表的同步。
  • 源数据库中的库名不允许为ib_logfile。
  • 增量同步时,要求源数据库打开归档日志。
  • 源数据库不允许含有空库。

目标数据库要求

  • 同步前,目标数据库必须存在待同步数据库及表,且库名,表名,列名,索引名、约束名等必须为对应的小写名称。
  • DRS同步时会有大量数据写入目标库,目标库max_allowed_packet 参数过小会导致无法写入,建议将目标库max_allowed_packet参数值设置为大于100MB。
  • 增量同步的表要禁用外键,因为DRS并行回放会使得不同表之间的写入顺序和源库不一致,可能会触发外键约束限制,造成同步失败。

操作限制

  • 表对象名同步到目标库后会转换成小写,如ABC和abc。因此增量同步阶段,选择的源库表中不能存在表名称字母相同但大小写不同的表,否则,会导致同步失败。
  • 由于无主键表缺乏行的唯一性标志,网络不稳定时涉及少量重试,表数据存在少量不一致的可能性。
  • 如有中文、日文等特殊字符,业务连接Oracle数据库使用的编码需和Oracle数据库服务端编码一致,否则目标库会出现乱码。
  • Oracle中表结构同步到DDM后表的字符集为utf8mb4。
  • Oracle中表结构长度(所有列长字节数之和,char、varchar2等类型字节长度和编码有关)超过65535时,可能导致同步失败。
  • 对于Oracle RAC集群,建议使用SCAN IP+ SERVICE_NAMES方式创建任务,SCAN IP具有更强的容错性,更好的负载能力,更快的同步体验。
  • 源库为Oracle RAC环境时,如果需要使用SCAN IP,需要保证SCAN IP与源库的所有VIP互通,否则无法通过连接检查。若不使用SCAN IP,可以使用某一节点的VIP,其他节点异常不影响同步。
  • 数据类型不兼容时,可能引起同步失败。
  • 当Oracle字符集是WE8MSWIN1252时,CLOB列同步到目标库可能出现乱码,建议先修改源库字符集为AL32UTF8再同步数据。
  • 同步过程中,不允许修改、删除连接源和目标数据库的用户的用户名、密码、权限,或修改源和目标数据库的端口号。
  • 同步过程中,源库不能做DDL变更。
  • 对于同步中的数据库对象,在同步期间,目标库不能进行写入操作,否则会导致数据不一致。
  • 全量同步分区表的结构时会将该对象转为非分区的普通表,增量同步时,源库跟分区表相关的操作,在目标库执行可能会失败。
  • 支持目标数据库中的表比源数据库多列场景。
    • 目标端多的列要求非空且没有默认值。
    • 目标端多的列不能包含主键索引或者唯一索引。
  • 增量同步时,BLOB末尾的0x00、CLOB末尾的空格会被截断。
  • 选择表级对象同步时,增量同步过程中不建议对表进行重命名操作。
  • 源库的用户对应目标库的数据库。
  • 源库用户、表结构信息同步至目标库后全部转换为小写。如表Ab及表AB同步至目标库为ab。
  • 不支持索引组织表的同步。
  • 同步任务全量阶段开始前,如有长时间未提交的事务,有可能丢失数据。
  • 任务再编辑增加新表时,请确保新增的表的事务都已提交,否则未提交的事务可能无法同步到目标库。建议在业务低峰期做增加表的操作。
分享:

    相关文档

    相关产品

close