数据集成
数据源管理
支持通过手动配置或批量导入的方式接入数据源

任务设计
数据同步模式
- 全量同步
离线同步模式中,在不设置任务前置过滤 SQL 的情况下,同步任务将执行对源端数据向目标端数据的全量同步。在组件上可以看到同步的数据量及运行时长等信息。
图5 全量同步 - 数据补录
当发生源端历史数据变更等情况时,通过在读取组件自定义 SQL,可以添加针对日期字段进行过滤的 WHERE 条件,可以实现针对特定时间段的数据补录需要。
图6 数据补录 - 增量同步
支持以当前位置、停止位置、指定位置作为采集起始点的不同模式的实时增量同步。其中,基于停止位置,可实现断点续传,使得网络中断等意外情况发生并恢复后,数据依旧可以完整无误的进行传输。
图7 增量同步 - 数据整合分发
针对分库分表数据整合场景及数据分发场景,可基于数据源逻辑组,通过多对一、一对多任务来实现批量任务的创建及运行。
图8 数据整合分发