更新时间:2024-01-26 GMT+08:00

集群配置管理

操作场景

CCE支持对集群配置参数进行管理,通过该功能您可以对核心组件进行深度配置。

约束与限制

本功能仅支持在v1.15及以上版本的集群中使用,v1.15以下版本不显示该功能。

操作步骤

  1. 登录CCE控制台,在左侧导航栏中选择“集群管理”
  2. 单击集群后的
  3. 在侧边栏滑出的“配置管理”窗口中,根据业务需求修改Kubernetes的参数值:

    表1 kube-apiserver组件配置参数

    参数

    详情

    取值

    default-not-ready-toleration-seconds

    表示节点处于NotReady状态下的容忍时间。

    默认情况下,每个Pod会添加该容忍度。

    默认:300s

    default-unreachable-toleration-seconds

    表示节点处于unreachable状态下的容忍时间。

    默认情况下,每个Pod会添加该容忍度。

    默认:300s

    max-mutating-requests-inflight

    最大mutating并发请求数。 当服务器超过此值时,它会拒绝请求。

    0表示无限制。该参数与集群规模相关,不建议修改。

    从v1.21版本开始不再支持手动配置,根据集群规格自动配置如下:

    • 50和200节点:200
    • 1000节点:500
    • 2000节点:1000

    max-requests-inflight

    最大non-mutating并发请求数。 当服务器超过此值时,它会拒绝请求。

    0表示无限制。该参数与集群规模相关,不建议修改。

    从v1.21版本开始不再支持手动配置,根据集群规格自动配置如下:

    • 50和200节点:400
    • 1000节点:1000
    • 2000节点:2000

    service-node-port-range

    NodePort端口范围,修改后需前往安全组页面同步修改节点安全组30000-32767的TCP/UDP端口范围,否则除默认端口外的其他端口将无法被外部访问。

    默认:

    30000-32767

    取值范围:

    min>20105

    max<32768

    request-timeout

    kube-apiserver组件的默认请求超时时间,请谨慎修改此参数,确保取值合理性,以避免频繁出现接口超时或其他异常。

    该参数仅v1.19.16-r30、v1.21.10-r10、v1.23.8-r10、v1.25.3-r10及以上版本集群支持。

    默认:

    1m0s

    取值范围:

    min>=1s

    max<=1h

    feature-gates: ServerSideApply

    kube-apiserver组件ServerSideApply特性开关,详情请参见服务器端应用(Server-Side Apply)

    该参数仅v1.19.16-r30、v1.21.10-r10、v1.23.8-r10、v1.25.3-r10及以上版本集群支持。

    默认:

    true

    support-overload

    集群过载控制开关,开启后将根据控制节点的资源压力,动态调整请求并发量,维护控制节点和集群的可靠性。

    该参数仅v1.23及以上版本集群支持。

    • false:不启用过载控制
    • true:启用过载控制
    表2 kube-scheduler组件配置参数

    参数

    详情

    取值

    kube-api-qps

    与kube-apiserver通信的qps

    • 集群规格为1000节点以下时,默认值100
    • 集群规格为1000节点及以上时,默认值200

    kube-api-burst

    与kube-apiserver通信的burst

    • 集群规格为1000节点以下时,默认值100
    • 集群规格为1000节点及以上时,默认值200

    enable-gpu-share

    是否开启GPU共享,该参数仅v1.23.7-r10、v1.25.3-r0及以上版本集群支持。

    • 关闭GPU共享时,需保证集群中的Pod没有使用共享GPU能力(即Pod不存在cce.io/gpu-decision的annotation)。
    • 开启GPU共享时,需保证集群中已使用GPU资源的Pod均存在cce.io/gpu-decision的annotation。

    默认:true

    表3 kube-controller-manager组件配置参数

    参数

    详情

    取值

    concurrent-deployment-syncs

    deployment的并发处理数

    默认:5

    concurrent-endpoint-syncs

    endpoint的并发处理数

    默认:5

    concurrent-gc-syncs

    garbage collector的并发数

    默认:20

    concurrent-job-syncs

    允许同时同步的作业对象的数量。

    默认:5

    concurrent-namespace-syncs

    namespace的并发处理数

    默认:10

    concurrent-replicaset-syncs

    replicaset的并发处理数

    默认:5

    concurrent-resource-quota-syncs

    resource quota的并发处理数

    默认:5

    concurrent-service-syncs

    service的并发处理数

    默认:10

    concurrent-serviceaccount-token-syncs

    serviceaccount-token的并发处理数

    默认:5

    concurrent-ttl-after-finished-syncs

    ttl-after-finished的并发处理数

    默认:5

    concurrent-rc-syncs

    rc的并发处理数

    说明:

    该参数仅在v1.21至v1.23版本集群中使用。v1.25版本后,该参数弃用(正式弃用版本为v1.25.3-r0)。

    默认:5

    horizontal-pod-autoscaler-sync-period

    集群弹性计算的周期

    默认:15s

    kube-api-qps

    与kube-apiserver通信的qps

    • 集群规格为1000节点以下时,默认值100
    • 集群规格为1000节点及以上时,默认值200

    kube-api-burst

    与kube-apiserver通信的burst

    • 集群规格为1000节点以下时,默认值100
    • 集群规格为1000节点及以上时,默认值200

    terminated-pod-gc-threshold

    在Pod GC开始删除终止Pod之前,可以存在的terminated状态Pod数量。

    如果<=0,则禁用终止的Pod GC。

    默认:1000

    表4 网络组件配置参数(仅CCE Turbo集群支持)

    参数

    详情

    取值

    nic-minimum-target

    集群级别的节点最少绑定容器网卡数

    默认:10

    nic-maximum-target

    集群级别的节点预热容器网卡上限检查值

    默认:0

    nic-warm-target

    集群级别的节点动态预热容器网卡数

    默认:2

    nic-max-above-warm-target

    集群级别的节点预热容器网卡回收阈值

    默认:2

    表5 扩展控制器配置参数(仅v1.21及以上版本集群支持)

    参数

    详情

    取值

    enable-resource-quota

    创建namespace时是否自动创建resourcequota对象。

    • false:不自动创建resourcequota对象。
    • true:自动创建resourcequota对象。resourcequota的默认取值请参见设置资源配额及限制

    默认:false

  4. 单击“确定”,完成配置操作。