更新时间:2026-06-10 GMT+08:00
ALM-50604 LDMS任务提交失败
告警解释
LDMS根据配置的分组作业队列,按规则提交调度Spark任务到Yarn上执行,若连续3次提交任务失败,则会上报该告警,后续分组作业队列提交成功后,告警消除。
本章节仅适用于MRS 3.6.0-LTS.1及之后版本。
告警属性
| 告警ID | 告警级别 | 是否可自动清除 |
|---|---|---|
| 50604 | 重要 | 是 |
告警参数
| 类别 | 参数名称 | 参数含义 |
|---|---|---|
| 定位信息 | 来源 | 产生告警的集群名称。 |
| 服务名 | 产生告警的服务名称。 | |
| 角色名 | 产生告警的角色名称。 | |
| 主机名 | 产生告警的主机名。 | |
| 附加信息 | Memory Usage Exceeds The Threshold | 产生告警的计算实例租户名和当前超过阈值的大小。 |
对系统的影响
LDMS调度任务提交失败会影响托管的表的使用可靠性,长期提交失败会导致托管的表长期未进行运维管理影响读写性能甚至导致表不可用。
可能原因
LDMS依赖的服务故障、后台调度任务过多资源不够等原因。
处理步骤
- 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > LDMS任务提交失败 > 定位信息”。查看告警上报实例所在的节点主机信息。
- 在FusionInsight Manager首页,选择“集群 > 服务 > LDMS> 实例”。
- 单击告警上报的实例角色,选择“概览 > 日志 > LDMSServer”。
- 下载LDMSServer日志查看报错原因。
- 请联系运维人员,并发送已收集的故障日志信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。