文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-18012 上个周期被终止的Yarn任务数超过阈值(2.x及以前版本)
更新时间:2024-09-04 GMT+08:00

ALM-18012 上个周期被终止的Yarn任务数超过阈值(2.x及以前版本)

告警解释

上个10min的周期内,发生被终止的YARN任务数超过阈值。该告警每10min检测一次,如果上个10min周期内,发生YARN任务被终止的数量大于设定的阈值时,会发生该告警。如果在下个10min周期,被终止的Yarn任务数低于阈值时该告警会自动消除。

告警属性

告警ID

告警级别

可自动清除

18012

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机名。

对系统的影响

无。

可能原因

有用户手动终止了正在运行的YARN任务。

处理步骤

排查YARN日志和审计日志,查看终止任务操作的下发者,确认终止任务的原因。

参考信息

无。