Lite Server资源热备管理
场景描述
Lite Server资源热备需要用户自建k8s集群。对于k8s集群中的机器资源通过打污点的方式,完成资源热备机的处理,从而使业务pod无法调度到该热备机上。
约束限制
根据下单使用的DevServer资源机器种类和台数不同,推荐您按照下面的表格进行热备机器台数准备。
资源类型\资源台数 |
小于10台 |
10台-49台 |
50台-99台 |
100台-249台 |
250台-499台 |
500台-749台 |
750台-1000台 |
1000台以上 |
---|---|---|---|---|---|---|---|---|
Snt9A |
0 |
1 |
2 |
3 |
5 |
7 |
10 |
12 |
Snt9B |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
10 |
GP Ant8 |
0 |
1 |
2 |
3 |
5 |
6 |
8 |
12 |
GP Vnt1 |
0 |
1 |
2 |
3 |
5 |
8 |
10 |
12 |
示例1:
当购买Snt9B类型的资源台数为6台时,该台数少于10台,因此根据热备机推荐表,此时不需要准备热备机,正常按照6台进行资源购买即可。
示例2:
当购买Snt9B类型的资源台数为600台时,该台数位于500至749台区间,因此根据热备机推荐表,此时需要额外准备热备机5台,因此需要按照605台进行资源购买。
前提条件
已购买的Lite Server资源中用户已自建k8s集群。
资源热备替换操作
当集群中的业务节点发生硬件故障等需要进行热备替换时,先进行数据备份,再进行故障机打污点和删除热备机污点的方式完成资源热备替换。
- 数据备份
推荐使用rsync工具进行文件备份,rsync是一个强大的文件同步工具,支持本地和远程同步,该工具可以灵活和高效地完成数据备份。
rsync -avz -e ssh /source/ user@remote:/destination/
将故障机文件备份到热备机上,以backup.txt文件为例。
以SSH的方式完成备份,备份完成后,可以在新的热备机上查看到该文件。
- 热备替换
对发生故障的节点打污点
kubectl taint nodes <node-name> dedicated=ops:NoSchedule
- <node-name>:替换为实际节点名称。
- dedicated=ops:污点的键值对。
- NoSchedule:污点的效果,表示kube-scheduler不会将Pod调度到该节点。
确认节点污点标签是否成功。
kubectl describe node <node-name> | grep Taints
可以看到该节点已成功打上不可调度的标签。
对进行热备替换的机器去除污点。
kubectl taint node <node-name> dedicated=ops:NoSchedule-
再次确认污点已去除
kubectl describe node <node-name> | grep Taints
至此已完成机器的热备替换,替换下来的故障机可以进行进入正常的维修流程。