文档首页/ MapReduce服务 MRS/ 故障排除/ 集群管理类/ MRS管理控制台上提交作业异常处理
更新时间:2023-11-10 GMT+08:00

MRS管理控制台上提交作业异常处理

用户问题

MRS控制台作业管理提交作业“状态”为“已接受”,“执行结果”为“未定”,作业未成功提交到Yarn上,如下图所示:

原因分析

由于管理控制台的作业管理功能是由集群管理模块Executor来负责调度执行,因此作业未提交到Yarn上,根因需要查看Executor。而管理控制台的作业管理功能,正常情况添加作业后会自动在Yarn上启动两个任务,一个提交到launcher-job队列,该队列为辅助作业队列。另外一个是作业实际执行的队列,如默认的default队列。

查看Executor日志(主Master节点的“/var/log/executor/exe.log”),发现是由于提交Flink作业用户的密码改变或者过期导致下载用户keytab认证文件失败,最终导致作业未提交到launcher-job队列。

处理步骤

  1. 重置提交作业用户的密码。

    登录Manager页面,选择“系统设置 > 用户管理”。在提交作业的IAM用户的操作列,选择“更多 > 初始化密码”,根据界面提示操作。初始化完成后需要使用该用户登录一次MRS Manager。

  2. 登录MRS管理控制台,进入MRS集群,在“概览”页面,单击“IAM用户同步”右侧的“单击同步”。
  3. IAM同步完成,作业管理添加配置作业提交作业即可正常。