Kafka消息压缩配置建议

应用场景

在Kafka消息存储与传输流程中，消息压缩是一种优化性能、降低资源开销的方法。Kafka支持GZIP、SNAPPY、LZ4等多种压缩算法，这些算法在消息写入磁盘前对其进行压缩，既能减少存储空间占用，也能在网络传输过程中降低带宽消耗。

压缩原理介绍：

Kafka压缩算法在生产者客户端配置时，即可同时优化“磁盘存储”和“网络传输”，也能提高吞吐量。如果Kafka压缩算法在服务端配置，不但会增加服务端的CPU、网络带宽等的消耗，导致性能瓶颈，还会降低吞吐量。

在生产者客户端配置压缩算法的原理如下：

生产者客户端压缩消息：生产者客户端配置指定压缩算法后，先将多条消息批量压缩成一个数据包，然后通过网络发布至服务端。
服务端存储消息：服务端接收数据包后，无需解压，直接存储到磁盘。
消费者客户端解压消息：消费者客户端从服务端拉取数据包后，根据它的压缩算法标识，使用对应的算法解压数据包，获取原始消息。

压缩算法对比：

Kafka支持的压缩算法在核心指标上存在显著差异，具体请参考表1。

表1 压缩算法核心指标说明
压缩算法	压缩率	压缩/解压速度	CPU消耗	适用场景
GZIP	高	慢	高	追求最高压缩率，可以接受较高的延迟和CPU消耗，网络传输成本极高的场景。
SNAPPY	中等	快	低	通用首选。在压缩率和压缩/解压速度之间有很好的平衡。CPU开销低，性能稳定。
LZ4	较低	极快	非常低	追求最高的压缩/解压速度，CPU开销最小。

配置消息压缩算法

在生产者客户端配置“compression.type”参数来启用指定类型的压缩算法。

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("acks", "all");
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
// 开启GZIP压缩
props.put("compression.type", "gzip");
 
Producer<String, String> producer = new KafkaProducer<>(props);

上一篇：Kafka Topic分区数设置建议

下一篇：配置消息堆积数监控

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问

Kafka消息压缩配置建议

应用场景

配置消息压缩算法

相关文档

意见反馈

文档内容是否对您有帮助？