配置Kafka/DMS Kafka源端参数
作业中源连接为Kafka连接或DMS Kafka连接时,源端作业参数如表1所示。
| 参数类型 | 参数 | 说明 | 取值样例 |
|---|---|---|---|
| 基本参数 | Topics | 支持单个或多个topic。 | est1,est2 |
| 数据格式 | 解析数据时使用的格式:
| 二进制格式 | |
| 偏移量参数 | 从Kafka拉取数据时的初始偏移量:
| 最新 | |
| 抽取数据最大运行时间 | 持续拉取数据时间。如天调度作业,根据每天topic产生的数据量,配置足够的拉取时间。单位:分钟。 | 60 | |
| 等待时间 | 当配置为60时,如果消费者60s内从Kafka拉取数据返回一直为空(一般是已经读完主题中的全部数据,也可能是网络或者Kafka集群可用性原因),则立即停止任务,否则持续重试读取数据。单位:秒。 | 60 | |
| 消费组ID | 用户指定消费组ID。 如果是从DMS Kafka导出数据,专享版请任意输入,标准版请输入有效的消费组ID。 | consumer-group | |
| 开始时间(>=) | “偏移量参数”选择为“时间范围”时配置。拉取数据的开始时间,包含设置时间点的数据。 | 2020-12-20 12:00:00 | |
| 结束时间(<) | “偏移量参数”选择为“时间范围”时配置。拉取数据的结束时间,不包含设置时间点的数据。 | 2020-12-20 20:00:00 | |
| 字段分隔符 | “数据格式”选择为“CSV格式”时配置。默认为空格,使用Tab键作为分隔符请输入“\t”。 | , | |
| 记录分隔符 | “数据格式”选择为“CSV格式”、“JSON”时配置。默认为空格,使用Tab键作为分隔符请输入“\t”。 | , | |
| 高级参数 | 使用配置文件 | “数据格式”选择为“CDC场景”时配置,用于配置OBS文件。 | 否 |
| OBS链接 | 选择OBS连接器信息。 | obs_link | |
| OBS桶 | 选择OBS桶。 | obs_test | |
| 配置文件 | 选择OBS的配置文件。 | /obs/config.csv | |
| 最大消息数/poll | 可选参数,每次向Kafka请求数据限制最大请求记录数。 | 100 | |
| 最大时间间隔/poll | 可选参数,向Kafka请求数据的最大时间间隔。 | 100 | |
| 通知Topic | 发送通知数据到通知Topic中。在CDC场景中,通知的内容是记录生成文件列表的文件名。 | notice |