文档首页/ MapReduce服务 MRS/ 常见问题/ 作业管理类/ 提交Flink作业时报错slot request timeout如何处理?
更新时间:2024-10-24 GMT+08:00

提交Flink作业时报错slot request timeout如何处理?

问题现象

Flink作业提交时,jobmanager启动成功,但taskmanager一直是启动中直到超时,报错如下:

org.apache.flink.runtime.jobmanager.scheduler.NoResourceAvailableException: Could not allocate the required slot within slot request timeout. Please make sure that the cluster has enough resources

可能原因

  • Yarn队列中资源不足,导致创建taskmanager启动不成功。
  • 用户的jar包与环境中的jar包冲突导致,可以通过执行wordcount程序是否成功来判断。
  • 如果集群为安全集群,可能是Flink的SSL证书配置错误,或者证书过期。

解决方法

  1. 增加队列的资源。
  2. 排除用户jar包中的Flink和Hadoop依赖,依赖环境中的jar包。
  3. 重新配置Flink的SSL证书,可参考从零开始使用Flink