文档首页/ MapReduce服务 MRS/ 用户指南(巴黎区域)/ 故障排除/ 使用Kafka/ Flume可以正常连接Kafka,但是发送消息失败。
更新时间:2024-10-11 GMT+08:00

Flume可以正常连接Kafka,但是发送消息失败。

问题现象

使用MRS版本安装集群,主要安装ZooKeeper、Flume、Kafka。

在使用Flume向Kafka发送数据功能时,发现Flume发送数据到Kafka失败。

可能原因

  1. Kafka服务异常。
  2. Flume连接Kafka地址错误,导致发送失败。
  3. Flume发送超过Kafka大小限制的消息,导致发送失败。

原因分析

Flume发送数据到Kafka失败,可能原因是Flume侧问题或者Kafka侧问题。

  1. Manager界面查看当前Kafka状态及监控指标。

    • MRS Manager界面操作:登录MRS Manager,选择 “服务管理 > Kafka ”,查看当前Kafka状态,发现状态为良好,且监控指标内容显示正确。
    • FusionInsight Manager界面操作:登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > Kafka,

      查看当前Kafka状态,发现状态为良好,且监控指标内容显示正确。

  2. 查看Flume日志,发现打印MessageSizeTooLargeException异常信息,如下所示:
    2016-02-26 14:55:19,126 | WARN  | [SinkRunner-PollingRunner-DefaultSinkProcessor] |  Produce request with correlation id 349829 failed due to [LOG,7]: kafka.common.MessageSizeTooLargeException  | kafka.utils.Logging$class.warn(Logging.scala:83)

    通过异常信息,发现当前Flume向Kafka写入的数据超过了Kafka服务端定义的消息的最大值。

  3. 通过Manager查看Kafka服务端定义的消息的最大值。
    • MRS Manager界面操作入口:登录MRS Manager,依次选择 “服务管理 > Kafka> 配置”。
    • FusionInsight Manager界面操作入口:登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > Kafka > 配置"。

    进入Kafka配置页面,参数类别选择全部配置,显示所有Kafka相关配置,在“搜索”中输入message.max.bytes进行检索。

    MRS中Kafka服务端默认可以接收的消息最大为1000012 bytes =977KB。

解决办法

与用户确认,当前Flume发送数据确实存在超过1M的消息。因此,为了确保当前这些消息能够写入Kafka,需要调整Kafka服务端相关参数。

  1. 修改message.max.bytes,使得message.max.bytes的值大于当前业务中消息最大值,使得Kafka服务端可以接收全部消息。
  2. 修改replica.fetch.max.bytes,使得replica.fetch.max.bytes >= message.max.bytes,使得不同Broker上的Partition的Replica可以同步到全部消息。

    • MRS Manager界面操作入口:登录MRS Manager,依次选择 “服务管理 > Kafka> 配置”。
    • FusionInsight Manager界面操作入口:登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > Kafka > 配置"。

    进入Kafka配置页面,参数类别选择全部配置, 显示所有Kafka相关配置,在“搜索”中输入replica.fetch.max.bytes进行检索。

  3. 单击“保存”,并重启Kafka服务,使得Kafka相关配置生效。
  4. 修改消费者业务应用中fetch.message.max.bytes,使得fetch.message.max.bytes >= message.max.bytes,确保消费者可以消费到全部消息。