更新时间:2025-08-07 GMT+08:00

数据对比(对比灾备项)

对比使用场景

对比灾备项可以对比业务数据库和灾备数据库的数据一致性,目前灾备对比功能支持以下几种对比方式:

  • 对象级对比:支持对数据库、索引、表、视图等对象进行对比。
  • 数据级对比分为行对比和内容对比。
    • 行对比:对比同步的表的行数是否一致,只查询表的行数,对比速度较快,建议优先使用。
    • 内容对比:对比同步的表内数据是否一致,需要查询每条数据进行对比,相较于行对比,内容对比较慢。

    为了确保对比结果具有可参考性,请通过“稍后启动”功能在业务低峰期或者无业务期进行数据对比,业务运行期间由于数据的持续变化,仅适合对一些业务的低频率修改的冷数据进行对比。

在使用对比功能查看数据一致性时,建议优先使用行数对比,确定行数是否一致。如果出现行数不一致的情况,可以针对不一致的表,使用内容对比,来确定具体有哪些数据不一致。

约束限制

  • 对比是大小写敏感的,如果业务数据库或灾备数据库一端为非大小写敏感,一端为大小写敏感,对比结果可能出现不一致的情况。
  • 如果在对比时业务数据库进行DDL操作,为保证对比结果的准确性,需重新进行内容对比。
  • 如果单独对灾备数据库进行数据修改操作,可能会导致对比结果不一致。
  • 如果业务数据库字符类型存在编码异常的情况,通过DRS灾备或对比时会因数据库驱动转码转换为异常码点,最终可能导致内容对比一致,实际字节不一致。
  • 内容对比功能目前只部分支持无主键的表,对于不支持内容对比的表可以使用行数对比功能。所以数据级对比功能需要结合业务场景,选用行数对比或者内容对比。
  • 无主键表内容对比仅支持静态内容对比,不支持动态内容对比。
  • DRS进行内容比对期间不能暂停DRS任务,否则可能导致比对任务失败。
  • 为避免占用资源,DRS对行对比的时长进行限制,超过限制时长,行对比任务自动停止。业务数据库是关系型数据库时,行对比限制时长为60分钟;业务数据库为非关系数据库,行对比限制时长为30分钟。
  • 为避免占用资源,DRS任务的对比结果限制保留60天,60天后自动清除。
  • MySQL、TaurusDB为源链路,源数据库中的虚拟列不支持内容对比,对比时会过滤虚拟列。
  • 当内容对比过程中表出现表DDL变化时,可能会引起任务失败,此时需要用户重新进行对比,建议对比过程中尽量减少对表的DDL变更。

对数据库影响

  • 对象对比:会查询源库及目标库的系统表,占用10个左右的session的连接数,正常情况不会对数据库产生影响。但是如果对象数量巨大(比如几十万张表),可能会对数据库产生一定的查询压力。
  • 行数对比:会查询源库及目标库的表行数,占用10个左右的session的连接数,正常的select count语句基本不会对数据库产生影响。但是如果表数据量巨大(亿级)会对数据库产生一定的查询压力,返回查询结果会比较慢。
  • 内容对比:会查询源库及目标库的全部数据,涉及每个字段都会对比,所以会对数据库产生一定的查询压力,主要体现在IO上,查询速度受限于源库和目标库的IO和网络带宽。占用1-2个CPU,占用10个左右的session的连接数。

对比耗时预估

  • 对象对比:根据源库查询性能,一般会在几分钟内返回结果,如果对象数据量特别巨大,对比时长可能达到几十分钟。
  • 行数对比:使用select count方式,查询速度跟数据库性能相关。
  • 内容对比:在数据库没有压力并且网络正常的情况下,对比速度大概是5MB/s。

前提条件

  • 已登录数据复制服务控制台。
  • 已启动灾备任务。

操作步骤

  1. “实时灾备管理”界面,选中指定灾备任务,单击任务名称,进入“基本信息”页签。
  2. 单击“灾备对比”页签,进入“灾备对比”信息页面,对业务数据库和灾备数据库的数据进行对比分析。

    1. 首先进行数据库对象完整性检查。

      在“对象级对比”页签,查看各个对比项的对比结果。

      若需要查看对比项的对比结果详情,可单击指定对比项操作列的“详情”。

    2. 对比任务提交成功后,返回“数据级对比”页签,单击刷新列表,可以查看到所选对比类型的对比结果。
    3. 若需要查看对比类型详情,可单击指定对比类型操作列的“查看对比报表”,然后选择需要进行对比的数据库,单击操作列的“查看详情”,查看指定业务数据库和灾备数据库的对比结果详情。
      • 支持限速的对比中的对比任务,列表界面支持查看“源库抽取速率”和“增量时延”(仅“动态对比”)信息:

        • 注意:上述统计信息默认每10秒刷新一次。
      • 支持限速的运行中的对比任务,单击“查看报表”支持查看全量对比进度、全量抽取速率、差异待复查行数、以及各个源库和目标库对应表的详细进度信息,同时如果任务包括动态对比,支持查看增量对比时延、增量速率、增量位点、差异待复查行数、每秒对比行数信息。

        • 注意:上述统计信息默认每10秒刷新一次。
      • 已取消的对比任务也支持查看对比报表。
      • 行对比结果可按照“源库表行数”或“目标库表行数”,对当前页面显示的结果进行升序或者降序排列,方便进行筛选。
      • 行对比差异显示为负数时,代表目标库表行数比源库表行数多;显示为正数时,代表源库表行数比目标库表行数多。

数据修复(公测中)

当静态内容对比结果中存在不一致数据时,可在对比报表的明细页中选取不一致的表进行数据修复。数据修复结果为可在目标库执行的修复SQL。修复完成后可在对比报表的修复进度明细页查看不一致行的修复SQL生成详情,也可导出和下载针对本次对比所有已生成的不一致SQL,并结合实际情况在目标库手动执行修复SQL。数据修复具有如下约束。

  1. 数据修复功能为受限使用阶段,当前仅支持MYSQL-MYSQL链路。
  2. 对于修复SQL为INSERT或UPDATE语句的场景,修复SQL中将展示不一致行的所有列内容,列值为对应列在源库的当前值。
  3. 历史的比对任务可能由于缺少修复信息而修复失败,需要重新比对后再进行修复。
  4. 每个灾备任务仅保留最新一次数据修复的修复进度明细信息页面。
  5. 单个不一致行的数据大小最大支持4M,超过时对应的修复SQL将生成失败。
  6. DRS生成的修复SQL中,时间类型字段的内容是基于UTC时间的,如果表中存在时间字段,目标库执行修复SQL前需先将会话时区设置为0时区。各数据库类型对应的会话时区设置SQL示例如下表。
  7. 请谨慎执行修复SQL中的DELETE语句。
表1 各数据库类型设置会话时区为0时区的SQL示例

数据库类型

时区设置SQL

MYSQL

SET session time_zone='+00:00';