Upsert Kafka结果表
功能描述
DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。
Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统,具有高吞吐量、内置分区、支持数据副本和容错的特性,适合在大规模消息处理场景中使用。
前提条件
Kafka是线下集群,需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。
注意事项
对接的Kafka集群不支持开启SASL_SSL。
语法格式
1 2 3 4 5 6 7 8 9 10 11 12 | create table kafkaSource( attr_name attr_type (',' attr_name attr_type)* (','PRIMARY KEY (attr_name, ...) NOT ENFORCED) ) with ( 'connector.type' = 'upsert-kafka', 'connector.version' = '', 'connector.topic' = '', 'connector.properties.bootstrap.servers' = '', 'format.type' = '' ); |
参数说明
参数 | 是否必选 | 说明 |
|---|---|---|
connector.type | 是 | connector类型,对于upsert kafka,需配置为'upsert-kafka' |
connector.version | 否 | Kafka版本,仅支持:'0.11' |
format.type | 是 | 数据序列化格式,支持:'csv', 'json'及'avro'等 |
connector.topic | 是 | kafka topic名 |
connector.properties.bootstrap.servers | 是 | kafka brokers地址,以逗号分隔 |
connector.sink-partitioner | 否 | 记录分区方式,支持:'fixed', 'round-robin'及'custom' |
connector.sink-partitioner-class | 否 | 'sink-partitioner'为'custom'时,需配置,如'org.mycompany.MyPartitioner' |
connector.sink.ignore-retraction | 否 | 是否忽略回撤消息,默认为false。回撤消息将以null值写入kafka |
update-mode | 否 | 支持:'append', 'retract'及'upsert'三种写入模式 |
connector.properties.* | 否 | 配置kafka任意原生属性 |
示例
create table upsertKafkaSink( car_id STRING, car_owner STRING, car_brand STRING, car_speed INT, primary key (car_id) not enforced ) with ( 'connector.type' = 'upsert-kafka', 'connector.version' = '0.11', 'connector.topic' = 'test-topic', 'connector.properties.bootstrap.servers' = 'xx.xx.xx.xx:9092', 'format.type' = 'csv' );

