check_input.xlsx配置
check_input.xlsx文件中包括用户输入信息:schema、原表名、目标表名、指定列名(缺省为全部列校验)、校验范围、校验级别(缺省为low),排除列,可以按需进行配置。
设置方法如下。
- 打开文件夹中的check_input.xlsx文件。
- 根据实际需要修改check_input.xlsx文件中参数的值。
check_input.xlsx文件中的参数说明见表1。
- 参数值不区分大小写。
- 除了列出的参数外,不得更改其他参数值。
- 保存后退出。
参数 |
说明 |
取值范围 |
默认值 |
样例 |
---|---|---|---|---|
Source Database Name |
指定需要校验的源表所属的database 名称,可选项,不填写表示使用dbinfo.properties中的src.dbname。 |
NA |
NA |
mydb |
Source Schema Name |
指定需要校验的源表所属的schema名称,不涉及则不填写。 |
NA |
NA |
myschema |
Source Table Name |
源端数据库需要校验的表名,必填项。 |
NA |
NA |
order_info |
Target Database Name |
目标端DWS表所属的database 名称,可选项,不填写表示使用dbinfo.properties中的dws.dbname。 |
NA |
NA |
dws_db |
Target Schema Name |
目标端DWS表所属的schema名称,必填项。 |
NA |
NA |
dws_sch |
Target Table Name |
目标端dws数据库需要校验的表名,必填项。 |
NA |
NA |
dws_info |
Row Range(Where sql) |
指定表记录的校验范围,默认为校验所有记录。 |
NA |
ALL |
where begin_time > '2020-1-1' and begin_time < '2021-1-1' |
Column Range |
可选,指定列校验,默认为所有支持类型字段,即:数值、时间、字符类型。 |
NA |
NA |
col1,col10,col19 |
Check Strategy |
数据校验级别。 |
|
low |
low |
Column Exclude |
可选,排除指定列的sum校验。 |
NA |
NA |
col1,col10,col19 |