缩容Task节点失败
问题现象
在MRS 2.x集群详情页面调整集群Task节点,将Task节点调整成0个,最终缩容失败,提示如下:
This operation is not allowed because the number of instances of NodeManager will be less than the minimum configuration after scale-in, which may cause data loss.
原因分析
用户将Core节点的NodeManager服务停止了,导致在检查Task节点退服过程中发现Task如果全部退订,则将没有NodeManager,则Yarn服务就不可用,而MRS判断剩余的NodeManager必须大于等于1才能退服Task节点。
处理步骤
- 进入Yarn服务实例页面:
- MRS 3.x之前版本,单击集群名称,登录集群详情页面,选择“组件管理 > Yarn > 实例”。
如果集群详情页面没有“组件管理”页签,请先完成IAM用户同步(在集群详情页的“概览”页签,单击“IAM用户同步”右侧的“同步”进行IAM用户同步)。
- MRS 3.x及后续版本,登录FusionInsight Manager。然后选择“集群 > 待操作的集群名称 > 服务 > Yarn > 实例”。
- MRS 3.x之前版本,单击集群名称,登录集群详情页面,选择“组件管理 > Yarn > 实例”。
- 勾选Core节点的NodeManager实例,选择“更多 > 启动实例”。
- 在集群列表页面缩容Task节点。
- 单击集群名称进入集群详情页面,选择“节点管理”。
- 在Task节点组所在行的“操作”列单击“缩容”。
图1 缩容Task
- 单击“确定”并在弹出框选择“是”。
- 等缩容成功后,若不想用Core节点的NodeManager再将其停止。
建议与总结
Core节点的NodeManager通常不会将其停止,建议不要随意变更集群部署结构。