文档首页/ MapReduce服务 MRS/ 组件操作指南(安卡拉区域)/ 使用CDL/ CDL常见问题/ CDL数据同步任务失败后,对应的Yarn任务等待10多分钟后才会重新运行
更新时间:2024-11-29 GMT+08:00

CDL数据同步任务失败后,对应的Yarn任务等待10多分钟后才会重新运行

现象描述

CDL数据同步任务失败,对应的Yarn任务等待10多分钟后才会重新运行,Yarn任务运行时间如下图所示:

可能原因

CDL数据同步任务失败,对应的Yarn任务会自动进行重试。但若Yarn任务在10分钟内重试20次后,仍然无法重新运行,则该任务存在配置或数据问题,会停止重试,休眠10分钟;休眠时间过期后,任务会继续重试。

处理步骤

  1. 登录FusionInsight Manager,选择“集群 > 服务 > Yarn”,单击“ResourceManager WebUI”右侧的“ResourceManager(主)”超链接,进入到Yarn WebUI界面。
  2. 搜索报错CDL任务名称,找到该任务运行的最新记录,单击“ID”列的对应任务ID,单击“Logs”,再单击“stdout”,根据stdout日志中的具体报错解决任务相应错误。
  3. 在FusionInsight Manager首页,选择“集群 > 服务 > CDL”,单击“CDLService UI”右侧的超链接进入CDL WebUI界面,选择该作业所在行的“更多 > 停止”,停止CDL任务。任务停止成功后,再单击“启动”,重新启动该任务。