更新时间:2024-08-08 GMT+08:00
分享

配置DWS目的端参数

表1 DWS作为目的端时的作业参数

参数类型

参数名

说明

取值样例

基本参数

模式或表空间

待写入数据的数据库名称,支持自动创建Schema。

单击输入框后面的按钮可选择模式或表空间。

整库迁移时无该参数。

schema

表名

写入数据的目标表名,单击输入框后面的按钮可进入表的选择界面。

整库迁移时无该参数。

该参数支持配置为时间宏变量,且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合,可以实现定期同步新增数据,详细说明请参见使用时间宏变量完成增量同步

说明:

如果配置了时间宏变量,通过DataArts Studio数据开发调度CDM迁移作业时,系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”,而不是“CDM作业实际启动时间-偏移量”。

table

导入模式

导入数据到DWS时,用户可以指定导入模式。

  • COPY模式,源数据经过管理节点后,复制到DWS的DataNode节点。
  • UPSERT模式,数据发生主键或唯一约束冲突时,更新除了主键和唯一约束列的其他列数据。
  • COPY_UPSERT模式,使用DWS专有的高性能批量入库工具。

COPY

导入开始前

导入数据前,选择是否清除目的表的数据:
  • 不清除:写入数据前不清除目标表中数据,数据追加写入。
  • 清除全部数据:写入数据前会清除目标表中数据。
  • 清除部分数据:需要配置“where条件”参数,CDM根据条件选择性删除目标表的数据。

清除部分数据

where条件

“导入开始前”参数选择为“清除部分数据”时配置,配置后导入前根据where条件删除目的表的数据。

age > 18 and age <= 60

高级属性

整库迁移时无该参数。

先导入阶段表

如果选择“是”,则启用事务模式迁移,CDM会自动创建临时表,先将数据导入到该临时表,导入成功后再通过数据库的事务模式将数据迁移到目标表中,导入失败则将目的表回滚到作业开始之前的状态。

默认为“否”,CDM直接将数据导入到目的表。这种情况下如果作业执行失败,已经导入到目标表中的数据不会自动回滚。

说明:

如果“导入开始前”选择“清除部分数据”或“清除全部数据”,CDM的事务模式不会回滚已经删除的数据。

导入前准备语句

执行任务之前率先执行的SQL语句。目前向导模式仅允许执行一条SQL语句。

create temp table

导入后完成语句

执行任务之后执行的SQL语句,目前仅允许执行一条SQL语句。

merge into

loader线程数

每个loader内部启动的线程数,可以提升写入并发数。

说明:

并发场景下有如下限制:约束冲突处理策略不支持"replace into"或"on duplicate key update"。

1

相关文档