如何根据集群中Pod数量调整插件配额?
当CCE Autopilot集群中Pod数量调整后,需要根据Pod的数量调整插件资源配额,以确保插件实例能够正常运行。例如,您将Pod数量从50调整为200,则需要增加插件CPU和内存的配额,防止插件实例因需要调度过多的节点而出现OOM等异常。本文仅提供部分Pod数量对应的插件配额参考,对于其他Pod数量的插件配额,可以根据现有参考数据进行换算。如果您无法确定插件配额,可以提交工单进行咨询。

本章节是基于典型业务场景的推荐值,您也可以基于实际业务场景,参考监控数据,适当调整插件资源规格。
CoreDNS域名解析插件
CCE Autopilot集群中的Pod数量增加时,coredns实例承受的压力也会同步增加。请根据Pod的数量,合理调整组件实例数和组件CPU/内存配额,具体请参见表1。
CCE容器弹性引擎插件
CCE Autopilot集群中的Pod数量增加时,customedhpa-controller实例承受的压力也会同步增加。请根据Pod数量,合理调整插件组件实例数和组件CPU/内存配额,具体请参见表2。
云原生监控插件
CCE Autopilot集群中的Pod数量增加时,该插件的相关组件承受的压力也会同步增加。请根据CCE Autopilot集群的Pod数量,合理调整采集分片数。
- 开启普罗高可用时,请参考以下配置:
表3 云原生监控插件配额建议-开启普罗高可用 Pod数量
采集分片数
组件名称
组件实例数
组件CPU配额
组件内存配额
50
2
prometheus-operator
2
1000m
2048Mi
prometheus-lightweight-shard-0
2
2000m
4096Mi
prometheus-lightweight-shard-1
2
2000m
4096Mi
kube-state-metrics
2
1000m
2048Mi
200
10
prometheus-operator
2
1000m
2048Mi
prometheus-lightweight-shard-x
(表示prometheus-lightweight组件的集合,每个组件的配额一致,并且组件个数随采集分片数增加而增加,“x”表示组件的序号)
2
2000m
4096Mi
kube-state-metrics
2
1000m
2048Mi
1000
50
prometheus-operator
2
1000m
2048Mi
prometheus-lightweight-shard-x
2
2000m
4096Mi
kube-state-metrics
2
1000m
2048Mi
- 未开启普罗高可用时,请参考以下配置:
表4 云原生监控插件配额建议-未开启普罗高可用 Pod数量
采集分片数
组件名称
组件实例数
组件CPU配额
组件内存配额
50
1
prometheus-operator
1
1000m
2048Mi
prometheus-lightweight
1
2000m
4096Mi
kube-state-metrics
1
1000m
2048Mi
200
5
prometheus-operator
1
1000m
2048Mi
prometheus-lightweight-shard-x
(表示prometheus-lightweight组件的集合,每个组件的配额一致,并且组件个数随采集分片数增加而增加,“x”表示组件的序号)
1
2000m
4096Mi
kube-state-metrics
1
1000m
2048Mi
1000
25
prometheus-operator
1
1000m
2048Mi
prometheus-lightweight-shard-x
1
2000m
4096Mi
kube-state-metrics
1
1000m
2048Mi
其他插件
除上述插件外,其他插件也可能因为集群规模调整而出现分配资源不足的情况,如您发现插件实例CPU或内存使用率明显增加,甚至出现OOM或无法运行的状况,请根据情况调整资源配额。如果您无法确定插件配额,可以提交工单进行咨询。