更新时间:2024-12-04 GMT+08:00
CCE集群纳管节点时的常见问题及排查方法?
概述
本文主要介绍纳管/添加已有的ECS实例到CCE集群的常见问题。
- 纳管时,会将所选弹性云服务器的操作系统重置为CCE提供的标准镜像,以确保节点的稳定性,请选择操作系统及重置后的登录方式。
- 所选弹性云服务器挂载的系统盘、数据盘都会在纳管时被格式化,请确保信息已备份。
- 纳管过程中,请勿在弹性云服务器控制台对所选虚拟机做任何操作。
约束与限制
- 集群版本需1.15及以上。
- 集群开启IPv6后,只支持纳管所在的子网开启了IPv6功能的节点;集群未开启IPv6,只支持纳管所在的子网未开启IPv6功能的节点。
- 原虚拟机节点创建时若已设置密码或密钥,纳管时您需要重新设置密码或密钥,原有的密码或密钥将会失效。
- 纳管节点时已分区的数据盘会被忽略,您需要保证节点至少有一个未分区且符合规格的数据盘。
前提条件
支持纳管符合如下条件的云服务器:
- 待纳管节点必须状态为“运行中”,未被其他集群所使用,且不携带 CCE 专属节点标签CCE-Dynamic-Provisioning-Node。
- 待纳管节点需与集群在同一虚拟私有云内(若集群版本低于1.13.10,纳管节点还需要与CCE集群在同一子网内)。
- 待纳管节点需挂载数据盘,可使用本地盘(磁盘增强型实例)或至少挂载一块20GiB及以上的数据盘,且不存在10GiB以下的数据盘。
- 待纳管节点规格要求:CPU必须2核及以上,内存必须4GiB及以上,网卡有且仅能有一个。
- 批量纳管仅支持添加相同规格、相同可用区、相同数据盘配置的云服务器。
排查步骤
您也可以参考以下步骤,通过集群日志查看节点纳管失败的报错信息,然后根据相应的解决方法解决问题:
- 登录CCE控制台,单击集群列表上方的“操作记录”查看具体的报错信息。
- 单击“操作记录”窗口中失败状态的报错信息。
- 根据上一步获取的失败报错信息自行解决后,尝试重新纳管节点。
常见问题
纳管节点失败,提示已分区磁盘会被忽略,报错内容如下:
Install config-prepare failed: exit status 1, output: [ Mon Jul 17 14:26:10 CST 2023 ] start install config-prepare\nNAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT\nsda 8:0 0 40G 0 disk \n└─sda1 8:1 0 40G 0 part /\nsdb 8:16 0 100G 0 disk \n└─sdb1 8:17 0 100G 0 part disk /dev/sda has been partition, will skip this device\nRaw disk /dev/sdb has been partition, will skip this device\nwarning: selector can not match any evs volume
请为节点添加一块未分区的数据盘,且数据盘规格为20GiB及以上,即可解决上述问题。纳管完成后,将使用未分区的数据盘作为容器引擎及kubelet组件的存储空间,已分区的数据盘会被忽略不作任何操作,请根据需求自行处理。
父主题: 节点创建