文档首页/ 数据湖探索 DLI/ 常见问题/ Flink作业类/ Flink作业性能调优类/ Jobmanager与Taskmanager心跳超时,导致Flink作业异常怎么办?
更新时间:2024-11-08 GMT+08:00

Jobmanager与Taskmanager心跳超时,导致Flink作业异常怎么办?

问题现象

Jobmanager与Taskmanager心跳超时,导致Flink作业异常。

图1 异常信息

根因分析

  1. 检查网络是否发生闪断,分析集群负载是否很高。
  2. 如果频繁出现Full GC, 建议排查代码,确认是否有内存泄漏。
    图2 Full GC

处理步骤

  • 如果频繁Full GC, 建议排查代码,是否有内存泄漏。
  • 增加单TM所占的资源。
  • 联系技术支持,修改集群心跳配置参数。