配置Kafka/DMS Kafka源端参数
作业中源连接为Kafka连接或DMS Kafka连接时,源端作业参数如表1所示。
参数类型 |
参数 |
说明 |
取值样例 |
---|---|---|---|
基本参数 |
Topics |
支持单个或多个topic。 |
est1,est2 |
数据格式 |
解析数据时使用的格式:
|
二进制格式 |
|
偏移量参数 |
从Kafka拉取数据时的初始偏移量:
|
最新 |
|
抽取数据最大运行时间 |
持续拉取数据时间。如天调度作业,根据每天topic产生的数据量,配置足够的拉取时间。单位:分钟。 |
60 |
|
等待时间 |
当配置为60时,如果消费者60s内从Kafka拉取数据返回一直为空(一般是已经读完主题中的全部数据,也可能是网络或者Kafka集群可用性原因),则立即停止任务,否则持续重试读取数据。单位:秒。 |
60 |
|
消费组ID |
用户指定消费组ID。 如果是从DMS Kafka导出数据,专享版请任意输入,标准版请输入有效的消费组ID。 |
sumer-group |
|
开始时间(>=) |
“偏移量参数”选择为“时间范围”时配置。拉取数据的开始时间,包含设置时间点的数据。 |
2020-12-20 12:00:00 |
|
结束时间(<) |
“偏移量参数”选择为“时间范围”时配置。拉取数据的结束时间,不包含设置时间点的数据。 |
2020-12-20 20:00:00 |
|
字段分隔符 |
“数据格式”选择为“CSV格式”时配置。默认为空格,使用Tab键作为分隔符请输入“\t”。 |
, |
|
记录分隔符 |
“数据格式”选择为“CSV格式”、“JSON”时配置。默认为空格,使用Tab键作为分隔符请输入“\t”。 |
, |
|
高级参数 |
使用配置文件 |
“数据格式”选择为“CDC场景”时配置,用于配置OBS文件。 |
否 |
OBS链接 |
选择OBS连接器信息。 |
obs_link |
|
OBS桶 |
选择OBS桶。 |
obs_test |
|
配置文件 |
选择OBS的配置文件。 |
/obs/config.csv |
|
最大消息数/poll |
可选参数,每次向Kafka请求数据限制最大请求记录数。 |
100 |
|
最大时间间隔/poll |
可选参数,向Kafka请求数据的最大时间间隔。 |
100 |
|
通知Topic |
发送通知数据到通知Topic中。在CDC场景中,通知的内容是记录生成文件列表的文件名。 |
notice |