文档首页> 云数据迁移 CDM> 常见问题> 故障处理类> Hudi目的端案例库> 执行作业后(非失败重试),作业执行卡Running,但是数据写入行数一直显示为0如何处理?
更新时间:2023-06-21 GMT+08:00

执行作业后(非失败重试),作业执行卡Running,但是数据写入行数一直显示为0如何处理?

问题排查

打开日志,最后一行日志如下所示,则说明此时集群并发资源消耗殆尽,或者集群内存使用达到阈值,新提交的作业需要排队等待。

submit task attempt_local1847334969_1748_m_000003_0, current waiting task number for job job_local1847334969_1748 is : 4

可能有如下原因

  • 集群并发数到达上限

    联系SRE查看cdm后台日志:/var/log/cdm/local/framework.log,搜索关键字:cluster running task,如果运行的并发数与available的并发数一致,则说明此时并发数已到达集群上限。

  • 集群内存使用达到阈值

    联系SRE查看cdm后台日志:/var/log/cdm/local/framework.log,搜索关键字:memory usage exceeds threshold,如果此时集群在不断打此日志,则说明堆内存使用已经超过75%,集群可能有oom的风险。

规避方案

调整作业并发数,使其不超过集群并发数(建议集群并发数不超过46)。集群并发数即配置管理页面的最大抽取并发数。

Hudi目的端案例库 所有常见问题

more