计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
弹性伸缩 AS
镜像服务 IMS
专属主机 DeH
函数工作流 FunctionGraph
云手机服务器 CPH
Huawei Cloud EulerOS
网络
虚拟私有云 VPC
弹性公网IP EIP
虚拟专用网络 VPN
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
VPC终端节点 VPCEP
云连接 CC
企业路由器 ER
企业交换机 ESW
全球加速 GA
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
边缘安全 EdgeSec
威胁检测服务 MTD
CDN与智能边缘
内容分发网络 CDN
CloudPond云服务
智能边缘云 IEC
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
云搜索服务 CSS
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
数据可视化 DLV
数据湖工厂 DLF
湖仓构建 LakeFormation
企业应用
云桌面 Workspace
应用与数据集成平台 ROMA Connect
云解析服务 DNS
专属云
专属计算集群 DCC
IoT物联网
IoT物联网
设备接入 IoTDA
智能边缘平台 IEF
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
国际站常见问题
ICP备案
我的凭证
支持计划
客户运营能力
合作伙伴支持计划
专业服务
区块链
区块链服务 BCS
Web3节点引擎服务 NES
解决方案
SAP
高性能计算 HPC
视频
视频直播 Live
视频点播 VOD
媒体处理 MPC
实时音视频 SparkRTC
数字内容生产线 MetaStudio
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
存储容灾服务 SDRS
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
专属分布式存储服务 DSS
容器
云容器引擎 CCE
容器镜像服务 SWR
应用服务网格 ASM
华为云UCS
云容器实例 CCI
管理与监管
云监控服务 CES
统一身份认证服务 IAM
资源编排服务 RFS
云审计服务 CTS
标签管理服务 TMS
云日志服务 LTS
配置审计 Config
资源访问管理 RAM
消息通知服务 SMN
应用运维管理 AOM
应用性能管理 APM
组织 Organizations
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
应用身份管理服务 OneAccess
数据库
云数据库 RDS
文档数据库服务 DDS
数据管理服务 DAS
数据复制服务 DRS
云数据库 GeminiDB
云数据库 GaussDB
分布式数据库中间件 DDM
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
人脸识别服务 FRS
图引擎服务 GES
图像识别 Image
内容审核 Moderation
文字识别 OCR
AI开发平台ModelArts
图像搜索 ImageSearch
对话机器人服务 CBS
华为HiLens
视频智能分析服务 VIAS
语音交互服务 SIS
应用中间件
分布式缓存服务 DCS
API网关 APIG
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
多活高可用服务 MAS
事件网格 EG
企业协同
华为云会议 Meeting
云通信
消息&短信 MSGSMS
云生态
合作伙伴中心
云商店
开发者工具
SDK开发指南
API签名指南
Terraform
华为云命令行工具服务 KooCLI
其他
产品价格详情
系统权限
管理控制台
客户关联华为云合作伙伴须知
消息中心
公共问题
开发与运维
应用管理与运维平台 ServiceStage
软件开发生产线 CodeArts
需求管理 CodeArts Req
部署 CodeArts Deploy
性能测试 CodeArts PerfTest
编译构建 CodeArts Build
流水线 CodeArts Pipeline
制品仓库 CodeArts Artifact
测试计划 CodeArts TestPlan
代码检查 CodeArts Check
代码托管 CodeArts Repo
云应用引擎 CAE
开天aPaaS
云消息服务 KooMessage
云手机服务 KooPhone
云空间服务 KooDrive

创建AHPA策略

更新时间:2025-01-06 GMT+08:00

Kubernetes原生HPA由于是被动触发,在实际应用中存在弹性滞后的问题。AHPA策略即Advanced Horizontal Pod Autoscaling,可根据业务历史指标,识别工作负载弹性周期并对未来波动进行预测,提前进行扩缩容动作,解决原生HPA的滞后问题。

功能介绍

AHPA通过对工作负载的历史指标进行监控,以周为维度进行建模,因此对具有明显周期性的工作负载具有更佳效果。

AHPA启动后拉取指定的工作负载过去一定时间的监控数据(至少一周,至多八周),利用统计学原理分析建模。随后每分钟一次,根据当前时间点的历史监控数据,结合未来一段时间窗口的历史数据,给出当前时间点工作负载的推荐副本数,提前准备Pod应对即将到来的业务量上涨,保障资源供给。

AHPA可与HPA策略以及CronHPA策略共同使用,实现复杂场景下的工作负载伸缩。

AHPA支持根据推荐结果调整HPA策略的最大和最小实例数,或者直接调整Deployment工作负载的副本数。

AHPA调整HPA策略最大和最小实例数的逻辑与CronHPA相同,可参考使用CronHPA调整HPA伸缩范围

前提条件

约束与限制

  • AHPA策略仅支持1.23及以上版本的集群。
  • 1.19.10及以上版本集群中,如果使用HPA策略对挂载了EVS卷的负载进行扩容,新Pod会因为无法挂载云硬盘导致无法成功启动。
  • CCE容器弹性引擎插件的资源使用量主要受集群中总容器数量和伸缩策略数量影响,通常场景下建议每5000容器配置CPU 500m, 内存1000Mi资源,每1000伸缩策略CPU 100m,内存500Mi。
  • AHPA需要对工作负载历史数据进行分析处理,需要额外内存,通常场景下建议每100个AHPA策略配置CPU 100m、内存 300Mi。
  • 创建AHPA策略后,不支持将已关联的工作负载修改为其他工作负载。
  • AHPA策略不支持和CustomedHPA策略同时启用。

使用AHPA策略

  1. 使用kubectl连接集群,详情请参见通过kubectl连接集群
  2. 部署一个示例工作负载。如果已有工作负载可忽略本步骤。推荐使用已收集超过7天以上监控数据的工作负载,AHPA生效需要7天或更久的监控数据。

    kubectl create -f hamster.yaml
    hamster.yaml文件内容如下:
    apiVersion: apps/v1
    kind: Deployment
    metadata:
      name: hamster
    spec:
      selector:
        matchLabels:
          app: hamster
      replicas: 2
      template:
        metadata:
          labels:
            app: hamster
        spec:
          containers:
            - name: hamster
              image: registry.k8s.io/ubuntu-slim:0.1
              resources:
                requests:
                  cpu: 100m
                  memory: 50Mi
              command: ["/bin/sh"]
              args:
                - "-c"
                - "while true; do timeout 0.5s yes >/dev/null; sleep 0.5s; done"

  3. 创建AHPA任务。

    kubectl create -f hamster-ahpa.yaml
    hamster-vpa.yaml文件内容如下:
    apiVersion: autoscaling.cce.io/v1alpha1
    kind: AdvancedHorizontalPodAutoscaler
    metadata:
      name: hamster-ahpa
      namespace: default
    spec:
      scaleTargetRef:  # 关联负载,当前支持 Deployment/HPA
        apiVersion: apps/v1
        kind: Deployment
        name: hamster
      minReplicas: 2  # 最小实例数
      maxReplicas: 10  # 最大实例数
      metrics:  # 指标列表,格式和社区HPA一致
      - type: Resource  # 指标源种类,当前只支持 Resource
        resource:
          name: cpu  # 指标源名称,当前只支持 cpu/memory
          target:
            type: Utilization  # 指标源类型,当前只支持 Utilization
            averageUtilization: 50
      predictConfig:
        predictWindowSeconds: 1800
        stabilizationWindowSeconds: 1800
        quantile: "0.97"
      effectiveTime:
      - '* * 11-22 ? * MON-FRI'  # 每周一到周五的11:00 - 22:00 生效
    表1 AHPA关键字段说明

    字段

    是否必填

    说明

    scaleTargetRef

    指定目标Deployment/HPA。

    metrics

    用于配置弹性Metrics,当前支持CPU、Memory两种指标。当前仅支持配置一种metric,不支持CPU和Memory同时配置。

    maxReplicas

    最大扩容实例数,取值范围为0~2147483647。

    须知:

    在CCE Turbo集群中,如果使用独享型ELB对接到工作负载,则最大实例数不能超过ELB的后端服务器组配额(默认为500),否则将会导致多余的实例无法添加到ELB后端。

    minReplicas

    最小缩容实例数,取值范围为0~2147483647。

    predictConfig.predictWindowSeconds

    推荐窗口时间,由当前时间点开始,在窗口范围内的指标历史值将参与推荐副本数计算,取值范围为1~3600。

    predictConfig.stabilizationWindowSeconds

    缩容冷却时间,取值范围为0~3600。

    predictConfig.quantile

    预测分位数,业务指标实际值低于设定目标值的概率,越大表示越保守。取值范围为0~1,支持两位小数,默认值为0.99。推荐取值范围为0.90~0.99。

    effectiveTime

    指定多个cron表达式,AHPA将在cron表达式的并集生效。默认总是生效。

  4. 待新建或已存在的工作负载至少收集7日以上监控数据到AOM中,AHPA即可建模成功并给出副本数推荐,等待AHPA生成副本推荐数,执行以下命令查看AHPA资源详情。

    kubectl get ahpa hamster-ahpa -oyaml

    回显如下:

    apiVersion: autoscaling.cce.io/v1alpha1
    kind: AdvancedHorizontalPodAutoscaler
    metadata:
      creationTimestamp: "2024-10-07T13:11:58Z"
      generation: 2
      name: hamster-ahpa
      namespace: default
      resourceVersion: "15529454"
      uid: e5ffbb01-50b0-4485-8cf5-bc2be884b1ee
    spec:
      effectiveTime:
      - '* * 11-22 ? * MON-FRI'
      maxReplicas: 10
      metrics:
      - resource:
          name: cpu
          target:
            averageUtilization: 50
            type: Utilization
        type: Resource
      minReplicas: 2
      predictConfig:
        predictWindowSeconds: 1800
        quantile: "0.97"
        stabilizationWindowSeconds: 1800
      scaleTargetRef:
        apiVersion: apps/v1
        kind: Deployment
        name: hamster
    status:
      conditions:
      - lastTransitionTime: "2024-10-07T13:24:19Z"
        message: the AHPA's model is ready
        reason: ModelIsReady
        status: "True"
        type: ModelAvailable
      - lastTransitionTime: "2024-10-07T13:24:19Z"
        message: the AHPA was able to successfully calculate a replica count
        reason: SucceededRunPrediction
        status: "True"
        type: ScalingActive
      - lastTransitionTime: "2024-10-07T13:24:19Z"
        message: ths ahpa checkpoint is fresh
        reason: CheckpointIsFresh
        status: "True"
        type: CheckpointAvailable
      - lastTransitionTime: "2024-10-07T13:24:19Z"
        message: recommended size matches current size
        reason: ReadyForNewScale
        status: "True"
        type: AbleToScale
      - lastTransitionTime: "2024-10-07T13:24:19Z"
        message: the desired replica count is more than the maximum replica count
        reason: TooManyReplicas
        status: "True"
        type: ScalingLimited
      currentReplicas: 10
      desiredReplicas: 10
      lastScaleTime: "2024-10-07T13:24:19Z"

  5. 不再使用AHPA策略时,可通过以下命令删除:

    kubectl delete ahpa hamster-ahpa

    AHPA 生效期间,会通过ahpacheckpoint的自定义资源保留未来6小时推荐值。若不再需要,可手动删除。

    kubectl delete ahpacheckpoint hamster-ahpa

我们使用cookie来确保您的高速浏览体验。继续浏览本站,即表示您同意我们使用cookie。 详情

文档反馈

文档反馈

意见反馈

0/500

标记内容

同时提交标记内容