更新时间:2024-11-29 GMT+08:00
CDL数据同步任务失败后,对应的Yarn任务等待10多分钟后才会重新运行
现象描述
CDL数据同步任务失败,对应的Yarn任务等待10多分钟后才会重新运行,Yarn任务运行时间如下图所示:
可能原因
CDL数据同步任务失败,对应的Yarn任务会自动进行重试。但若Yarn任务在10分钟内重试20次后,仍然无法重新运行,则该任务存在配置或数据问题,会停止重试,休眠10分钟;休眠时间过期后,任务会继续重试。
处理步骤
- 登录FusionInsight Manager,选择“集群 > 服务 > Yarn”,单击“ResourceManager WebUI”右侧的“ResourceManager(主)”超链接,进入到Yarn WebUI界面。
- 搜索报错CDL任务名称,找到该任务运行的最新记录,单击“ID”列的对应任务ID,单击“Logs”,再单击“stdout”,根据stdout日志中的具体报错解决任务相应错误。
- 在FusionInsight Manager首页,选择“集群 > 服务 > CDL”,单击“CDLService UI”右侧的超链接进入CDL WebUI界面,选择该作业所在行的“更多 > 停止”,停止CDL任务。任务停止成功后,再单击“启动”,重新启动该任务。
父主题: CDL常见问题