配置Kafka/DMS Kafka源端参数
作业中源连接为Kafka连接或DMS Kafka连接时,源端作业参数如表1所示。
| 
       参数类型  | 
     
       参数  | 
     
       说明  | 
     
       取值样例  | 
    
|---|---|---|---|
| 
       基本参数  | 
     
       Topics  | 
     
       支持单个或多个topic。  | 
     
       est1,est2  | 
    
| 
       数据格式  | 
     
       解析数据时使用的格式: 
  | 
     
       二进制格式  | 
    |
| 
       偏移量参数  | 
     
       从Kafka拉取数据时的初始偏移量: 
  | 
     
       最新  | 
    |
| 
       抽取数据最大运行时间  | 
     
       持续拉取数据时间。如天调度作业,根据每天topic产生的数据量,配置足够的拉取时间。单位:分钟。  | 
     
       60  | 
    |
| 
       等待时间  | 
     
       当配置为60时,如果消费者60s内从Kafka拉取数据返回一直为空(一般是已经读完主题中的全部数据,也可能是网络或者Kafka集群可用性原因),则立即停止任务,否则持续重试读取数据。单位:秒。  | 
     
       60  | 
    |
| 
       消费组ID  | 
     
       用户指定消费组ID。 如果是从DMS Kafka导出数据,专享版请任意输入,标准版请输入有效地消费组ID。  | 
     
       sumer-group  | 
    |
| 
       开始时间(>=)  | 
     
       “偏移量参数”选择为“时间范围”时配置。拉取数据的开始时间,包含设置时间点的数据。  | 
     
       2020-12-20 12:00:00  | 
    |
| 
       结束时间(<)  | 
     
       “偏移量参数”选择为“时间范围”时配置。拉取数据的结束时间,不包含设置时间点的数据。  | 
     
       2020-12-20 20:00:00  | 
    |
| 
       字段分隔符  | 
     
       “数据格式”选择为“CSV格式”时配置。默认为空格,使用Tab键作为分隔符请输入“\t”。  | 
     
       ,  | 
    |
| 
       记录分隔符  | 
     
       “数据格式”选择为“CSV格式”、“JSON”时配置。默认为空格,使用Tab键作为分隔符请输入“\t”。  | 
     
       ,  | 
    |
| 
       高级参数  | 
     
       使用配置文件  | 
     
       “数据格式”选择为“CDC场景”时配置,用于配置OBS文件。  | 
     
       否  | 
    
| 
       OBS链接  | 
     
       选择OBS连接器信息。  | 
     
       obs_link  | 
    |
| 
       OBS桶  | 
     
       选择OBS桶。  | 
     
       obs_test  | 
    |
| 
       配置文件  | 
     
       选择OBS的配置文件。  | 
     
       /obs/config.csv  | 
    |
| 
       最大消息数/poll  | 
     
       可选参数,每次向Kafka请求数据限制最大请求记录数。  | 
     
       100  | 
    |
| 
       最大时间间隔/poll  | 
     
       可选参数,向Kafka请求数据的最大时间间隔。  | 
     
       100  | 
    |
| 
       通知Topic  | 
     
       发送通知数据到通知Topic中。在CDC场景中,通知的内容是记录生成文件列表的文件名。  | 
     
       notice  |