文档首页/ 云数据迁移 CDM/ 常见问题/ 故障处理类/ Hudi目的端的作业执行卡Running,数据写入行数一直显示为0如何处理?
更新时间:2024-11-12 GMT+08:00
分享

Hudi目的端的作业执行卡Running,数据写入行数一直显示为0如何处理?

问题描述

打开日志,最后一行日志如下所示,则说明此时集群并发资源消耗殆尽,或者集群内存使用达到阈值,新提交的作业需要排队等待。

submit task attempt_local1847334969_1748_m_000003_0, current waiting task number for job job_local1847334969_1748 is : 4

原因分析

  • 集群并发数到达上限

    联系SRE查看cdm后台日志:/var/log/cdm/local/framework.log,搜索关键字:cluster running task,如果运行的并发数与available的并发数一致,则说明此时并发数已到达集群上限。

  • 集群内存使用达到阈值

    联系SRE查看cdm后台日志:/var/log/cdm/local/framework.log,搜索关键字:memory usage exceeds threshold,如果此时集群在不断打此日志,则说明堆内存使用已经超过75%,集群可能有oom的风险。

解决方案

调整作业并发数,使其不超过集群并发数(建议集群并发数不超过46)。集群并发数即配置管理页面的最大抽取并发数。

相关文档