更新时间:2022-02-24 GMT+08:00
缩容Task节点失败
用户问题
客户在MRS 2.x集群详情界面执行调整集群,将Task节点调整成0个,最终缩容失败。
问题现象
客户在MRS集群详情页面调整集群Task节点,最终缩容失败,提示“This operation is not allowed because the number of instances of NodeManager will be less than the minimum configuration after scale-in, which may cause data loss.”
原因分析
客户将Core节点的NodeManager服务停止了,导致在检查Task节点退服过程中发现Task如果全部退订,则将没有NodeManager,则Yarn服务就不可用,而MRS判断剩余的NodeManger必须大于等于1才能退服Task节点。
处理步骤
- 勾选Core节点的NodeManager实例,选择“更多 > 启动实例”。
- 在集群列表页面缩容Task节点。
- 单击集群名称进入集群详情页面,选择“节点管理”。
- 在Task节点组所在行的“操作”列单击“缩容”。
- 单击“确定”并在弹出框选择“是”。
- 等缩容成功后,若不想用Core节点的NodeManager再将其停止。
建议与总结
Core节点的NodeManager通常不会将其停止,客户不要随意变更集群部署结构。
父主题: 集群管理类