更新时间:2024-09-13 GMT+08:00
分享

源端为Apache Kafka,目的端为MRS Kafka

该链路目前仅支持分库分表场景。

分库分表场景

  1. 源端配置。
    • Kafka配置。
      • 数据格式:支持的数据格式。

        目前支持JSON、CSV、TEXT格式。

      • 消费组ID:由用户指定,标识当前实时处理集成作业的消费组。

        当迁移作业消费DMS Kafka集群某一Topic的消息后,在Kafka集群的“消费组管理”可以看到此处配置的消费组ID、在“消息查询”可以查到消费属性group.id。因为Kafka把消费消息的一方称为消费者(Consumer),多个消费者组成一个消费组(Consumer Group),消费组是Kafka提供的可扩展且具有容错性的消费者机制,建议配置消费组。

      • Kafka源端属性配置:支持设置Kafka的配置项,需要增加 properties. 前缀,作业将自动移除前缀并传入底层Kafka客户端,例如:properties.connections.max.idle.ms=600000。
    • 添加数据源。
      图1 添加数据源
  1. 目标端配置。
    图2 配置目标端参数
    • 设置源表与Topic映射规则:
      • 目标Topic名称规则:源端表名与目的端Topic名的映射规则,可以指定为单一Topic,也可使用内置字段做映射。

        可以使用的内置变量有:#{source_topic_name}:源主题名

      • 同步kafka partition策略:选择kafka partition策略。
        • 按源端分区投递到对应的Partition:源端消息在第n个分区,则投递到目的端的第n个分区,该策略可以保证消息顺序。
        • 按轮询模式投递到不同的Partition:采用Kafka粘性分区策略均匀的投递到目的端主题的所有分区,该策略无法保证消息顺序。
        • 全部投递到Partition 0。
      • 新建Topic的Partition数量:设置新建Topic的Partition数量,默认为3。
      • Kafka目标端属性配置:支持设置Kafka的配置项,需要增加 properties. 前缀,作业将自动移除前缀并传入底层Kafka客户端,例如:properties.connections.max.idle.ms=600000作业提交后目标端会额外添加一个内置参数dataFormat。
    • 源表与目标表映射:支持用户根据实际需求修改映射后的目的端topic名称,可以配置为一对一、多对一的映射关系。
      图3 配置源表与目标表映射

相关文档