更新时间:2026-05-20 GMT+08:00
CCE集群纳管节点时的常见问题及排查方法?
概述
本文主要介绍纳管/添加已有的ECS实例到CCE集群的常见问题。
- 纳管时,会将所选弹性云服务器的操作系统重置为CCE提供的标准镜像,以确保节点的稳定性,请选择操作系统及重置后的登录方式。
- 所选弹性云服务器挂载的系统盘、数据盘都会在纳管时被格式化,请确保信息已备份。
- 纳管过程中,请勿在弹性云服务器控制台对所选虚拟机做任何操作。
约束与限制
- 纳管节点支持ECS(弹性云服务器)节点、BMS(裸金属服务器)节点、DeH(专属主机)节点。
前提条件
待纳管的云服务器需要满足以下前提条件:
- 待纳管节点必须为“运行中”或者“关机”状态,未被其他集群所使用,且不携带 CCE 专属节点标签CCE-Dynamic-Provisioning-Node。
- 待纳管节点需与集群在同一虚拟私有云内(若集群版本低于1.13.10,纳管节点还需要与CCE集群在同一子网内)。
- 待纳管节点的系统组件使用独立磁盘存储时需挂载数据盘,可使用本地盘(磁盘增强型实例)或至少挂载一块20GiB及以上的数据盘,且不存在10GiB以下的数据盘。关于节点挂载数据盘的操作说明,请参考新增磁盘。
- 待纳管节点规格要求:CPU必须2核及以上,内存必须4GiB及以上,网卡有且仅能有一个。
- 批量纳管仅支持添加相同数据盘配置的云服务器。
- 集群开启IPv6后,只支持纳管所在的子网开启了IPv6功能的节点。
- CCE Turbo集群要求节点支持Sub-ENI或可以绑定至少16张ENI网卡,具体规格请参见创建节点时控制台上可以选择的节点规格。
- 纳管节点时已分区的数据盘会被忽略,您需要保证节点至少有一个未分区且符合规格的数据盘。
排查步骤
您也可以参考以下步骤,通过集群日志查看节点纳管失败的报错信息,然后根据相应的解决方法解决问题:
- 登录CCE控制台,单击集群列表上方的“操作记录”查看具体的报错信息。
- 查看“操作记录”窗口中失败状态的报错信息。
- 根据上一步获取的失败报错信息自行解决后,尝试重新纳管节点。
常见问题
找不到未分区磁盘导致纳管失败
问题现象
纳管节点失败,报错内容如下:
disk /dev/vda has been partition, will skip this device\nRaw disk /dev/vdb has been partition, will skip this device\nwarning: selector can not match any evs volume

问题根因
报错中提示/dev/vda和/dev/vdb磁盘均被分区,节点选择数据盘时会跳过已分区磁盘,导致纳管失败。
进入对应节点查看磁盘信息:
lsblk

确认是否存在可用于CCE节点数据盘的磁盘。如上图所示,vda被分区为vda1,vdb被分区为vdb1。由于CCE选盘逻辑会跳过已分区的磁盘,导致节点选盘失败,最终重置/纳管失败。
解决方案
- 方案一:请为节点添加一块未分区的数据盘,且数据盘规格为20GiB及以上,即可解决上述问题。纳管完成后,系统将使用未分区的数据盘作为容器运行时及kubelet组件的存储空间,已分区的数据盘会被忽略不作任何操作,请根据需求自行处理。
- 方案二:清理原磁盘分区后,重试节点重置/纳管。
清理磁盘分区会导致磁盘数据清空,请确认影响和风险后谨慎执行。
运行 fdisk <数据盘名称> 命令,再输入“d”,输入分区编号,输入“w”保存。
运行结果示例如下:
