更新时间:2024-04-15 GMT+08:00

对比同步项

对比使用场景

对比实时同步项可以清晰反馈出源数据库和目标数据库的数据是否存在差异。为了尽可能减少业务的影响和业务中断时间,实时同步场景提供了以下几种对比方式:

  • 对象级对比:支持对数据库、索引、表、视图、存储过程和函数、表的排序规则等对象进行对比。
  • 数据级对比分为行对比和内容对比。
    • 行对比:对比同步的表的行数是否一致,只查询表的行数,对比速度较快,建议优先使用。
    • 内容对比:对比同步的表内数据是否一致,需要查询每条数据进行对比,相较于行对比,内容对比较慢。

在使用对比功能查看数据一致性时,建议优先使用行数对比,确定行数是否一致。如果出现行数不一致的情况,可以针对不一致的表,使用内容对比,来确定具体有哪些数据不一致。

约束限制

  • 对比需要在任务处于增量阶段才能创建。
  • 单全量任务结束的时候,DRS会自动创建对象对比和行对比。如果源库有数据操作,可能会导致对比结果不一致。
  • 如果在对比时源库进行DDL操作,为保证对比结果的准确性,需重新进行内容对比。
  • 如果单独对目标库进行数据修改操作,可能会导致对比结果不一致。
  • 内容对比功能目前只支持带有主键的表,对于不支持内容对比的表可以使用行数对比功能。所以数据级对比功能需要结合业务场景,选用行数对比或者内容对比。
  • 为避免占用资源,DRS对行对比的时长进行限制,超过限制时长,行对比任务自动停止。源库是关系型数据库时,行对比限制时长为60分钟;源库为非关系数据库,行对比限制时长为30分钟。
  • 为避免占用资源,DRS任务的对比结果限制保留60天,60天后自动清除。
  • 行对比的多对一场景,是将源库中的表与映射到目标库中的聚合表中对应的那部分数据做行数比对。
  • 不支持多对一任务进行内容对比。
  • PostgreSQL为源的链路,在表映射场景下,索引和约束名称也会被修改,导致索引和约束的对比不一致。

前提条件

  • 已登录数据复制服务控制台。
  • 已启动同步任务。

创建对比任务

  1. “实时同步管理”界面,选中指定同步任务,单击任务名称,进入“基本信息”页签。
  2. 单击“同步对比”页签,进入“同步对比”信息页面。
  3. 对比同步项。

    • 创建对象级对比:选择“对象级对比”页签,观察源数据库和目标数据库的各个对比项结果是否一致。如果需要查看结果详情,可单击指定对比项操作列的“详情”按钮。
    • 创建数据级对比:选择“数据级对比”页签,单击“创建对比任务”,选择“对比类型”、“对比时间”和“对象选择”,单击“是”提交对比任务。
      • 对比类型:分为行数对比和内容对比。
        • 行数对比:用于对比源和目标端的表的行数是否相等。
          • 任务进入增量阶段后,用户可以创建行对比任务。
        • 内容对比:用于对比源和目标端的表的数据是否一致。
          • 任务进入增量阶段后,用户可以创建内容对比任务。全量同步完成后,源库数据不能发生变更,否则内容对比结果会不一致。

          由于内容对比功能目前只支持带有主键的表,不支持内容对比的表可以使用行数对比功能。所以数据级对比功能需要结合业务场景,选用行数对比或者内容对比。

      • 对比策略:分为普通对比和多对一对比两种。
        • 普通对比策略:源库中的一张表跟映射到目标库中的那张表做整表的行数比对。
        • 多对一对比策略:源库中的一张表跟映射到目标库中的聚合表中对应的那部分数据做行数比对。

          对比类型为行数对比时,支持对比策略选择。

      • 对比时间:可设置为“立即启动”“稍后启动”。由于同步具有轻微的时差,在数据持续操作过程中进行对比任务,可能会出现符合实际情况的少量数据不一致对比结果,推荐结合对比定时功能,选择在业务低峰期进行对比,得到更为具有参考性的对比结果。
      • 对象选择:可根据具体的业务场景选择需要进行对比的对象。

  4. 对比任务提交成功后,返回“数据级对比”页签,单击刷新列表,可以查看到所选对比类型的对比结果。

    由于内容对比功能目前只支持带有主键的表,不支持内容对比的表可以使用行数对比功能。所以数据级对比功能需要结合业务场景,选用行数对比或者内容对比。

    如果需要查看行数对比或者内容对比详情,可单击指定对比类型操作列的“查看对比报表”,页面将跳转至新的窗口,可观察对比结果的详细情况。

    如果需要下载行数对比或者内容对比结果,可单击指定对比类型操作列的“导出报告”。

    • 运行中的任务可以随时取消,已取消的对比任务也支持查看对比报表。
    • 行对比结果可按照“源库表行数”或“目标库表行数”,对当前页面显示的结果进行升序或者降序排列,方便进行筛选。
    • 行对比差异显示为负数时,代表目标库表行数比源库表行数多;显示为正数时,代表源库表行数比目标库表行数多。