更新时间:2025-09-17 GMT+08:00
Flink任务运行过程中出现报错“netty.exception.RemoteTransportException”
问题现象
Flink任务运行过程中出现报错:netty.exception.RemoteTransportException。
原因分析
处理步骤
- 原因一解决方案:
- 业务侧调大整taskmanager的启动内存。
- 若业务侧存在反压,则增大业务的整体并发,消除反压。
若以上都不存在,请业务侧排查代码中是否存在内存泄漏。建议业务可以将自动重启机制开启。如在“flink-conf.xml”中将配置“restart-strategy:”设置为“failure-rate”。
- 原因二解决方案:
- 查看是否节点存在os配置不合理的情况。
- 根据“判断Flink任务是否存在线程泄漏”的方法,判定是否有内存泄漏的风险。(用jstack去判断)
- 原因三解决方案:
- 修复磁盘故障。
- 建议业务可以将自动重启机制开启。如在“flink-conf.xml”中将配置“restart-strategy:”设置为“failure-rate”。
父主题: 使用Flink