check_input.xlsx配置
check_input.xlsx文件中包括用户输入信息:schema、原表名、目标表名、指定列名(缺省为全部列校验)、校验范围、校验级别(缺省为low),排除列,可以按需进行配置。
设置方法如下。
- 打开文件夹中的check_input.xlsx文件。
- 根据实际需要修改check_input.xlsx文件中参数的值。check_input.xlsx文件中的参数说明见表1。

- 参数值不区分大小写。
- 除了列出的参数外,不得更改其他参数值。
- 保存后退出。
参数 | 说明 | 取值范围 | 默认值 | 样例 |
|---|---|---|---|---|
Source Database Name | 指定需要校验的源表所属的database 名称,可选项,不填写表示使用dbinfo.properties中的src.dbname。 | NA | NA | mydb |
Source Schema Name | 指定需要校验的源表所属的schema名称,不涉及则不填写。 | NA | NA | myschema |
Source Table Name | 源端数据库需要校验的表名,必填项。 | NA | NA | order_info |
Target Database Name | 目标端DWS表所属的database 名称,可选项,不填写表示使用dbinfo.properties中的dws.dbname。 | NA | NA | dws_db |
Target Schema Name | 目标端DWS表所属的schema名称,必填项。 | NA | NA | dws_sch |
Target Table Name | 目标端dws数据库需要校验的表名,必填项。 | NA | NA | dws_info |
Check Mode | 校验模式:统计值校验,精准校验,元数据校验 |
|
| Statistics |
Src Row Range(Where sql) | 指定源数据表记录的校验范围,默认为校验所有记录。 | NA | ALL | where begin_time > '2020-1-1' and begin_time < '2021-1-1' |
DWS Row Range(Where sql) | 指定目标(DWS)表记录的校验范围,默认为校验所有记录。 | NA | ALL | where begin_time > '2020-1-1' and begin_time < '2021-1-1' |
Column Range | 可选,指定列校验,默认为所有支持类型字段,即:数值、时间、字符类型。 | NA | NA | col1,col10,col19 |
Check Strategy | 数据校验级别。 |
| low | low |
Sort Column | 可选,精确校验时根据Sort Column字段进行排序,如果Sort Column为空,则根据主键进行排序,排序后逐行对比。 | NA | NA | col1,col10,col19 |
Column Exclude | 可选,排除指定列的校验。 | NA | NA | col1,col10,col19 |
Columns Without Sum | 可选,排除指定列的sum校验。 | NA | NA | col1,col10,col19 |

