文档首页/ 华为云UCS/ 用户指南/ 集群联邦/ 多集群负载伸缩/ 创建使用自定义指标的HPA策略

更新时间：2026-03-30 GMT+08:00

创建使用自定义指标的HPA策略

Kubernetes默认的HPA策略只支持基于CPU和内存的自动伸缩，在复杂的业务场景中，仅使用CPU和内存使用率指标进行弹性伸缩往往无法满足日常运维需求。通过自定义指标配置工作负载HPA策略，可以根据业务自身特点，通过更多指标实现更灵活的弹性配置。

图1 使用自定义指标的HPA策略示意图
点击放大

本文介绍如何部署示例Nginx应用，并通过Prometheus标准方式暴露container_cpu_usage_core_per_second的指标用来标识容器每秒使用CPU核心数。关于Prometheus指标的更多信息，请参见metric_type。

步骤一：安装云原生监控插件

登录CCE控制台，单击集群名称进入集群。
单击左侧导航栏的“插件中心”，在页面右侧找到云原生监控插件，单击“安装”。

建议您关注以下配置，其他配置可按需进行设置。
- 数据存储配置：选择本地数据存储和监控数据上报至对接AOM服务。
- 自动服务发现：如果使用Annotations监控自定义指标，还需要开启插件的“自动服务发现”开关，否则将无法自动发现并采集指标。
插件配置完成后，单击“安装”。

步骤二：注册Metrics API

需将Prometheus注册为Metrics API的服务，详情如下。

仅云原生监控插件开启本地数据存储时，可通过Metrics API提供基础资源指标。
如果集群中已安装“Kubernetes Metrics Server”插件，需要卸载此插件。

容器和节点的资源指标，如CPU、内存使用量，可通过Kubernetes的Metrics API获得。这些指标可以直接被用户访问，比如用kubectl top命令，也可以被HPA或者CustomedHPA使用，根据资源使用率使负载弹性伸缩。

插件可为Kubernetes提供Metrics API，但默认未开启，若要将其开启，需要创建以下APIService对象：

apiVersion: apiregistration.k8s.io/v1
kind: APIService
metadata:
  labels:
    app: custom-metrics-apiserver
    release: cceaddon-prometheus
  name: v1beta1.metrics.k8s.io
spec:
  group: metrics.k8s.io
  groupPriorityMinimum: 100
  insecureSkipTLSVerify: true
  service:
    name: custom-metrics-apiserver
    namespace: monitoring
    port: 443
  version: v1beta1
  versionPriority: 100

可以将该对象保存为文件，命名为metrics-apiservice.yaml，然后执行以下命令：

kubectl create -f metrics-apiservice.yaml

执行kubectl top pod -n monitoring命令，若显示如下，则表示Metrics API能正常访问：

NAME                                                      CPU(cores)   MEMORY(bytes)
......
custom-metrics-apiserver-d4f556ff9-l2j2m                  38m          44Mi
......

卸载插件时，需要执行以下kubectl命令，同时删除APIService对象，否则残留的APIService资源将导致Kubernetes Metrics Server插件安装失败。

kubectl delete APIService v1beta1.metrics.k8s.io

步骤三：修改配置文件

在集群控制台左侧导航栏中选择“配置与密钥”，切换至“monitoring”命名空间。
更新user-adapter-config配置项，通过修改user-adapter-config中rules字段将Prometheus暴露出的指标转换为HPA可关联的指标。

添加以下示例规则：
```
rules:
    - seriesQuery: 'container_cpu_usage_seconds_total{namespace!="",pod!=""}'
      seriesFilters: []
      resources:
        overrides:
          namespace:
            resource: namespace
          pod:
            resource: pod
      name:
        matches: "^(.*)_seconds_total"
        as: "${1}_core_per_second"
      metricsQuery: 'sum(rate(<<.Series>>{<<.LabelMatchers>>}[1m])) by (<<.GroupBy>>)'
```
此配置项示例中，通过现有的container_cpu_usage_seconds_total指标，聚合成 container_cpu_usage_core_per_second 指标，供后续的HPA策略中使用。关于采集规则配置详情请参见Metrics Discovery and Presentation Configuration。
- seriesQuery：PromQL请求数据（用户需要查询的指标，可根据实际情况填写）。
- metricsQuery：对seriesQuery中PromQL请求的数据进行聚合操作。
- resources：是PromQL里的数据Label，与resource进行匹配。此处的resource是指集群内的api-resource，例如Pod、Namespace和Node。您可以通过kubectl api-resources -o wide命令查看。此处Key对应Prometheus数据中的LabelName，请确认Prometheus指标数据中有此LabelName。
- name：指根据正则匹配把Prometheus指标名转为比较可读的指标名，此处将container_cpu_usage_seconds_total转为container_cpu_usage_core_per_second。
重新部署monitoring命名空间下的custom-metrics-apiserver工作负载。

等待约15秒后，执行命令查看指标是否添加成功。

kubectl get --raw  "/apis/custom.metrics.k8s.io/v1beta1/namespaces/default/pods/*/container_cpu_usage_core_per_second"

点击放大

步骤四：创建示例工作负载

通过联邦控制台创建工作负载，详情请参见无状态负载。

步骤五：创建HPA策略

在联邦控制台中创建HPA策略，选择上一步创建的工作负载作为伸缩目标。详情请参见创建FederatedHPA策略以按指标扩缩工作负载。

父主题： 多集群负载伸缩

上一篇：管理CronFederatedHPA策略

下一篇：为集群添加标签与污点

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问

创建使用自定义指标的HPA策略

步骤一：安装云原生监控插件

步骤二：注册Metrics API

步骤三：修改配置文件

步骤四：创建示例工作负载

步骤五：创建HPA策略

相关文档

意见反馈

文档内容是否对您有帮助？