更新时间:2022-12-14 GMT+08:00

缩容Task节点失败

用户问题

客户在MRS 2.x集群详情界面执行调整集群,将Task节点调整成0个,最终缩容失败。

问题现象

客户在MRS集群详情页面调整集群Task节点,最终缩容失败,提示“This operation is not allowed because the number of instances of NodeManager will be less than the minimum configuration after scale-in, which may cause data loss.”

原因分析

客户将Core节点的NodeManager服务停止了,导致在检查Task节点退服过程中发现Task如果全部退订,则将没有NodeManager,则Yarn服务就不可用,而MRS判断剩余的NodeManger必须大于等于1才能退服Task节点。

处理步骤

  1. 勾选Core节点的NodeManager实例,选择“更多 > 启动实例”。

  2. 在集群列表页面缩容Task节点。

    1. 单击集群名称进入集群详情页面,选择“节点管理”。
    2. 在Task节点组所在行的“操作”列单击“缩容”。
    3. 单击“确定”并在弹出框选择“是”。

  3. 等缩容成功后,若不想用Core节点的NodeManager再将其停止。

建议与总结

Core节点的NodeManager通常不会将其停止,客户不要随意变更集群部署结构。