初次启动JobGateway后提交作业失败,无法提交作业到Yarn上
问题
初次启动JobGateway提交作业失败,无法提交到Yarn上,无launcher-job ID生成。
查看Yarn界面,无launcher-job队列:
查看Manager界面接口返回,显示有launcher-job信息:
查看所有的JobServer日志,均有“Create and modify launcher-job tenant failed.”打印。
回答
- 以omm用户登录主管理节点,执行如下命令,获取launcher-Job租户的tenantID。
curl -ki -L -u 用户名:密码 "https://$(hostname -i):9022/mrsmanager/api/v2/clusters/1/tenants/resource_allocation/super_scheduler?resource_pool_name=default&parent_tenant_name=root&limit=10&offset=0&filter="
- 执行如下命令,删除launcher-job,其中launcher-job的租户id为1中获取的tenantID。
curl -k -i --basic -u admin:{密码} -X DELETE 'https://{omsIp}:28443/web/api/v2/clusters/1/tenants/{launcher-job的租户id}'
- 登录到FusionInsight Manager界面,选择“集群 > 服务 > JobGateway> 实例”,滚动重启所有JobServer实例。
- 待重启完成后,登录Yarn原生界面,观察是否有launcher-job队列生成,观察是否能提交作业成功。