文档首页/ 云容器引擎 CCE/ 用户指南/ 调度/ 云原生混部/ CPU Burst弹性限流

更新时间：2025-08-11 GMT+08:00

查看PDF

CPU Burst弹性限流

若Pod中容器设置了CPU Limit值，则该容器CPU使用将会被限制在Limit值以内，形成对CPU的限流。频繁的CPU限流会影响业务性能，增大业务长尾响应时延，对于时延敏感型业务的影响尤为明显。

CPU Burst提供了一种可以短暂突破CPU Limit值的弹性限流机制，以降低业务长尾响应时间。其原理是业务在每个CPU调度周期内使用的CPU配额有剩余时，系统对这些CPU配额进行累计，在后续的调度周期内如果需要突破CPU Limit时，使用之前累计的CPU配额，以达到突破CPU Limit的效果。

未开启CPU Burst时，容器可以使用的CPU配额会被限制在Limit以内，无法实现Burst。
图1 未开启CPU Burst
开启CPU Burst后，容器使用的CPU配额可以突破Limit限制，实现Burst。
图2 开启CPU Burst

约束与限制

集群版本：CCE Turbo集群且集群版本为v1.23.5-r0及以上。
OS版本：Huawei Cloud EulerOS 2.0。
集群中需要安装Volcano 1.9.0及以上版本的插件，且开启混合部署开关。

操作步骤

登录CCE控制台，单击集群名称进入集群。
在左侧导航栏中选择“节点管理”，在需要开启CPU Burst弹性限流的节点池中，单击“更多 > 混部配置”。

确认“节点池混部开关”及“CPU Burst 弹性限流”开关已打开，详情请参见云原生混部配置。

已有的混部策略中，当CPU Burst开关由打开到关闭时，已经设置CPU Burst的存量Pod不会关闭CPU Burst功能，关闭CPU Burst仅针对新建的Pod生效。

在已打开混合部署的节点池中部署工作负载。以nginx为例，设置CPU Request为2，Limit为4，并为工作负载创建集群内访问的Service。

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx
  namespace: default
spec:
  replicas: 1
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
      annotations: 
        volcano.sh/enable-quota-burst: "true"
        volcano.sh/quota-burst-time: "200000"
    spec:
      containers:
      - name: container-1
        image: nginx:latest
        resources:
          limits:
            cpu: "4"
          requests:
            cpu: "2"
      imagePullSecrets:
        - name: default-secret
---
apiVersion: v1
kind: Service
metadata:
  name: nginx
  namespace: default
  labels:
    app: nginx
spec:
  selector:
    app: nginx
  ports:
    - name: cce-service-0
      targetPort: 80
      nodePort: 0
      port: 80
      protocol: TCP
  type: ClusterIP

注解	是否必选	描述
volcano.sh/enable-quota-burst	是	为工作负载开启CPU Burst。
volcano.sh/quota-burst-time	否	为保障CPU调度稳定性以及降低多个容器同时发生CPU Burst时的争用，默认设置的CPU Burst值与CPU Quota值相等，即容器最多可以使用两倍的CPU Limit值，默认为Pod内所有业务容器设置CPU Burst。例如容器的CPU Limit值为4时，CPU Burst默认值为400000（此处1核=100000），表示达到Limit值后最多可以额外使用4核CPU。

注解

是否必选

描述

volcano.sh/enable-quota-burst

是

为工作负载开启CPU Burst。

volcano.sh/quota-burst-time

否

为保障CPU调度稳定性以及降低多个容器同时发生CPU Burst时的争用，默认设置的CPU Burst值与CPU Quota值相等，即容器最多可以使用两倍的CPU Limit值，默认为Pod内所有业务容器设置CPU Burst。

例如容器的CPU Limit值为4时，CPU Burst默认值为400000（此处1核=100000），表示达到Limit值后最多可以额外使用4核CPU。

验证CPU Burst。

您可以使用wrk工具对工作负载进行加压，观察开启和关闭CPU Burst时业务的时延、限流情况、突破CPU limit的情况。

使用以下命令为Pod加压，其中<service_ip>为Pod关联的Service IP。

# 您需要在节点上下载并安装wrk工具
# 在Apache配置中开启了Gzip压缩模块, 用于模拟服务端处理请求的计算逻辑。
# 执行加压命令, 需注意修改目标应用的IP地址。
wrk -H "Accept-Encoding: deflate, gzip" -t 4 -c 28 -d 120  --latency --timeout 2s http://<service_ip>

获取Pod ID。

kubectl get pod -n <namespace> <pod_name> -o jsonpath='{.metadata.uid}'

限流情况和突破CPU limit的情况可以在节点上通过以下命令查看，其中<pod_id>为Pod的ID。

cat /sys/fs/cgroup/cpu/kubepods/burstable/pod<pod_id>/cpu.stat

回显示例如下：

nr_periods 0  #经过多少个调度周期
nr_throttled 0  #容器被限流的次数
throttled_time 0  #容器总的被限流的时间（纳秒）
nr_bursts 0 #容器突破CPU limit的次数
burst_time 0 #容器总共burst的时间

表1 本例中结果汇总
是否开启CPU Burst	p99时延	nr_throttled 限流次数	throttled_time 总限流时间	nr_bursts 突破limit值次数	bursts_time 总突破limit时间
未开启CPU Burst	2.96ms	986	14.3s	0	0
开启CPU Burst	456us	0	0	469	3.7s

父主题：云原生混部

上一篇：基于Pod实例画像的资源超卖

下一篇：出口网络带宽保障

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问

CPU Burst弹性限流

约束与限制

操作步骤

相关文档

意见反馈

文档内容是否对您有帮助？