|
Deployment |
concurrent-deployment-syncs |
表示Deployment的并发处理数。 |
默认:5 |
控制台/API |
|
Endpoint |
concurrent-endpoint-syncs |
表示Endpoint的并发处理数。 |
默认:5 |
控制台/API |
|
GC回收 |
concurrent-gc-syncs |
表示Garbage Collector的并发数。 |
默认:20 |
控制台/API |
|
Job |
concurrent-job-syncs |
表示允许同时同步的作业对象的数量。 |
默认:5 |
控制台/API |
|
CronJob |
concurrent-cron-job-syncs |
表示允许同时同步的定时任务对象的数量。 |
默认:5 |
控制台/API |
|
Namespace |
concurrent-namespace-syncs |
表示Namespace的并发处理数。 |
默认:10 |
控制台/API |
|
ReplicaSet |
concurrent-replicaset-syncs |
表示ReplicaSet的并发处理数。 |
默认:5 |
控制台/API |
|
ResourceQuota |
concurrent-resource-quota-syncs |
表示Resource Quota的并发处理数。 |
默认:5 |
控制台/API |
|
Service |
concurrent-service-syncs |
表示Service的并发处理数。 |
默认:10 |
控制台/API |
|
ServiceAccountToken |
concurrent-serviceaccount-token-syncs |
表示ServiceAccount Token的并发处理数。 |
默认:5 |
控制台/API |
|
TTLAfterFinished |
concurrent-ttl-after-finished-syncs |
表示ttl-after-finished的并发处理数。 |
默认:5 |
控制台/API |
|
RC |
concurrent_rc_syncs(v1.19及以下版本集群中使用)
concurrent-rc-syncs(v1.21至v1.25.3-r0版本集群中使用) |
表示RC的并发处理数。
在v1.25.3-r0及以上版本的集群中,该参数已弃用。 |
默认:5 |
控制台/API |
|
HPA并发处理数 |
concurrent-horizontal-pod-autoscaler-syncs |
表示HPA弹性伸缩并发处理数。 |
v1.27以下版本集群中默认为1,v1.27及以上版本以下集群中默认为5
取值范围为1-50 |
控制台/API |
|
Pod水平伸缩同步的周期 |
horizontal-pod-autoscaler-sync-period |
水平弹性伸缩控制器同步Pod数量的周期。配置越小弹性伸缩器反应越及时,同时CPU负载也越高。
配置建议:建议保持默认值。
配置风险:周期配置过长可能导致控制器处理响应慢;周期配置过短则会对集群管控面造成压力,产生过载风险。 |
默认:15s |
控制台/API |
|
Pod水平伸缩容忍度 |
horizontal-pod-autoscaler-tolerance |
该配置影响控制器对伸缩策略相关指标反应的灵敏程度,当配置为0时,指标达到策略阈值时立即触发弹性。
配置建议:请结合业务资源占用行为特点配置。如业务资源占用随时间的“突刺”特征明显,建议保留一定的容忍度值,避免因业务短时资源占用飚高导致预期之外的弹性行为。 |
默认:0.1 |
控制台/API |
|
HPA CPU初始化期间 |
horizontal-pod-autoscaler-cpu-initialization-period |
该期间内,只有Pod当前处于就绪状态并完成了最近一次指标采集,其指标才会被HPA统计使用。设置该字段可以在Pod启动初期过滤掉不稳定的CPU使用数据,进而防止基于瞬时峰值做出错误的扩缩容决策。
配置建议:如果您观察到Pods在启动阶段的CPU使用率波动导致HPA做出错误的扩展决策,可以适当增加此值。
配置风险:设置值过低可能导致基于CPU峰值做出过度反应的扩容;而设置的过高则可能在实际需要扩容时造成延迟反应。
适用集群版本:v1.23.16-r0、v1.25.11-r0、v1.27.8-r0、v1.28.6-r0、v1.29.2-r0及以上版本的集群支持该参数。 |
默认:5分钟 |
控制台/API |
|
HPA初始就绪状态延迟 |
horizontal-pod-autoscaler-initial-readiness-delay |
在HPA的CPU初始化期间后,该就绪延迟期间允许HPA以一个较宽松的标准筛选CPU度量数据。在这段时间内,即使Pod的就绪状态有所变化,HPA也会统计使用它们的CPU使用数据进行扩缩容。该字段有助于在Pod状态频繁变化时,确保CPU使用数据被持续追踪。
配置建议:如果Pods在启动后的就绪状态发生波动,并且您需要避免此波动导致HPA的误判,可以适当增加此值。
配置风险:参数值设置过低可能会在Pod刚进入就绪状态时,因CPU数据波动导致不恰当的扩容行为;而设置过高则可能导致在需要快速反应时HPA无法立即做出决策。
适用集群版本:v1.23.16-r0、v1.25.11-r0、v1.27.8-r0、v1.28.6-r0、v1.29.2-r0及以上版本的集群支持该参数。 |
默认:30s |
控制台/API |
|
控制器访问kube-apiserver的QPS |
kube-api-qps |
表示与kube-apiserver通信的qps。 |
- 集群规格为1000节点以下时,默认值100
- 集群规格为1000节点及以上时,默认值200
|
控制台/API |
|
控制器访问kube-apiserver的突发流量上限 |
kube-api-burst |
表示与kube-apiserver通信的burst。 |
- 集群规格为1000节点以下时,默认值100
- 集群规格为1000节点及以上时,默认值200
|
控制台/API |
|
终止状态pod触发回收的数量阈值 |
terminated-pod-gc-threshold |
表示集群中可保留的终止状态Pod数量,终止状态Pod超出该数量时将会被删除。
该参数设置为0时,表示保留所有终止状态的Pod。 |
默认:1000
取值范围为10-12500
集群版本为v1.21.11-r40、v1.23.8-r0、v1.25.6-r0、v1.27.3-r0及以上时,取值范围调整为0-100000 |
控制台/API |
|
可用区亚健康阈值 |
unhealthy-zone-threshold |
当给定区域中处于非就绪状态的节点占比高于此值时,会将该区域认定为不健康。针对不健康的区域,故障节点业务的迁移频率会降级,从而避免规模故障场景下大规模迁移操作产生更坏的影响。
配置建议:建议保持默认配置。
配置风险:阈值配置过大可能导致区域在规模故障场景下仍尝试执行大规模迁移动作,导致集群过载等风险。
适用集群版本:v1.23.14-r0、v1.25.9-r0、v1.27.6-r0、v1.28.4-r0及以上版本的集群支持该参数。 |
默认:0.55
取值范围为0-1 |
控制台/API |
|
节点迁移速率 |
node-eviction-rate |
表示当某区域健康时,在节点故障的情况下每秒最多可以驱逐多少个节点上的Pods。该值默认设置为0.1,代表每10秒钟内至多可以驱逐一个节点的Pods。
配置建议:建议按比例折算后每批迁移Pod数量不超过300。如果迁移速率设置过大可能引入集群过载风险,同时每批迁移重调度的Pod过多,大量Pod无法及时调度,影响整体故障恢复时间。
适用集群版本:v1.23.14-r0、v1.25.9-r0、v1.27.6-r0、v1.28.4-r0及以上版本的集群支持该参数。 |
默认:0.1 |
控制台/API |
|
次级节点迁移速率 |
secondary-node-eviction-rate |
表示当某区域不健康时,在节点故障的情况下每秒最多可以驱逐多少个节点上的Pods。该值默认设置为0.01,代表每100秒钟内至多从驱逐一个节点的Pods。
配置建议:配合node-eviction-rate设置,一般建议设置为node-eviction-rate的十分之一。
配置风险:区域亚健康场景迁移速率设置过大无实际意义,且可能引入集群过载风险。
使用集群版本:v1.23.14-r0、v1.25.9-r0、v1.27.6-r0、v1.28.4-r0及以上版本的集群支持该参数。 |
默认:0.01
|
控制台/API |
|
大规模集群大小阈值 |
large-cluster-size-threshold |
用于判断是否属于大规模集群,当集群内节点数量大于此参数时,集群被判断为大规模集群。
配置建议:在拥有大量节点的集群中,适当增加此阈值可以帮助提高控制器的性能和响应速度。对于规模较小的集群,保持默认值即可。在调整此参数时,建议先在测试环境中验证其对性能的影响,后在生产环境中应用。
配置风险:被视为大型集群时,kube-controller-manager会进行特定配置调整,从而优化大规模集群性能。因此,如果阈值过低,规模小的集群用上的大集群的配置,反而降低性能。
适用集群版本:v1.23.14-r0、v1.25.9-r0、v1.27.6-r0、v1.28.4-r0及以上版本的集群支持该参数。 |
默认:50
|
控制台/API |