更新时间:2025-02-18 GMT+08:00

集群概述

云容器引擎(Cloud Container Engine,简称CCE)是一个企业级的Kubernetes集群托管服务,支持容器化应用的全生命周期管理,为您提供高度可扩展的、高性能的云原生应用部署和管理方案。

集群类型

  • CCE Standard集群:是云容器引擎服务的标准版本集群,提供商用级容器集群服务,并完全兼容开源Kubernetes集群标准功能。无需管理和运维控制节点,可根据业务场景选择使用容器隧道网络模型或VPC网络模型,适合对性能和规模没有特殊要求的通用场景。
  • CCE Turbo集群:基于云原生基础设施构建的云原生2.0容器引擎服务,具备软硬协同、网络无损、安全可靠、调度智能的优势,为用户提供一站式、高性价比的全新容器服务体验。提供了面向大规模高性能的场景云原生2.0网络,容器直接从VPC网段内分配IP地址,容器和节点可以分属不同子网,支持VPC内的外部网络与容器IP直通,享有高性能。
  • CCE Autopilot集群:是云容器引擎服务推出的Serverless版集群,提供免运维的容器服务,并提供经过优化的Kubernetes兼容能力。用户无需对节点的部署、管理和安全性进行维护,并根据CPU和内存资源用量按需付费。

更多关于集群的详细对比,请参见集群类型对比

核心功能

功能

描述

集群管理

  • 集群创建:您可以根据需求创建不同类型的集群,灵活选择集群规模,动态扩展或缩减集群资源,以应对业务需求的变化,从而实现高效、灵活和经济的资源管理。详情请参见购买集群
  • 集群升级:您可以升级Kubernetes版本以使用最新的功能,同时提升系统的稳定性和性能。详情请参见升级集群

节点/节点池管理

  • 异构资源管理:全面适配华为云各类计算实例,支持虚拟机和裸机混合部署、高性价比鲲鹏实例、GPU和昇腾算力。详情请参见节点概述节点池概述
  • 灵活配置:支持节点池灵活配置,支持在同一节点池中配置不同规格、不同计费方式的节点,支持自定义的Kubernetes参数配置,满足多样化的业务需求。
  • 弹性伸缩:支持自动扩缩节点,实现资源的高弹性管理,快速响应负载变化,以优化资源利用率和降低成本。详情请参见节点弹性伸缩

工作负载

  • 工作负载生命周期管理:支持多种工作负载类型,支持创建、升级、回滚等全生命周期操作,支持环境变量、持久化存储、应用日志采集等多种配置。详情请参见工作负载概述
  • 亲和调度:支持节点亲和性调度、工作负载亲和/反亲和调度,以满足不同场景的调度诉求。详情请参见工作负载调度策略概述
  • 弹性伸缩:支持配置HPA、CronHPA、CustomedHPA等多种工作负载弹性伸缩策略。详情请参见工作负载弹性伸缩
  • 发布:支持多种不同访问方式的灰度发布和蓝绿发布,以确保应用在更新和迁移过程中保持高可用性和稳定性。

调度

  • 异构资源调度:
    • GPU:支持以GPU实例作为集群工作节点,并具备全面的GPU兼容生态,支持GPU调度、监控、弹性伸缩等全生命周期操作。详情请参见GPU调度
    • GPU虚拟化:支持对GPU设备显存与算力进行动态划分,多个容器共享一个GPU设备且相互隔离,提高GPU利用率。详情请参见GPU虚拟化
    • NPU:支持以NPU实例作为集群工作节点,并提供NPU调度、NPU监控、NPU弹性伸缩和NPU运维管理功能。详情请参见NPU调度
  • 高级调度策略:CCE采用Volcano调度引擎提供多种高级调度策略,如装箱调度重调度负载感知调度优先级调度与抢占公平调度组调度NUMA亲和性调度在离线业务混合部署等,以提升应用性能和集群整体资源利用率。

网络

存储

  • 存储插件:支持CSI存储插件。CCE容器存储(Everest)是CCE基于CSI开发的存储插件,能够为容器提供不同类型的持久化存储功能。
  • 存储类别:支持云硬盘存储、文件存储、极速文件存储、对象存储、专属存储、本地持久卷、临时存储卷等多种类型的存储卷。详情请参见存储概述

弹性伸缩

  • 工作负载弹性伸缩:支持根据业务需求和策略调整工作负载的副本数量,详情请参见工作负载伸缩原理
  • 节点弹性伸缩:支持在集群资源紧张时自动扩容节点数量,资源闲置时自动缩容节点数量,在满足业务诉求的前提下同时减少资源闲置,提高经济性。详情请参见节点伸缩原理

云原生观测

  • 健康中心:支持对集群健康状况进行全面检查,帮助您及时发现集群故障与潜在风险,并给出应对的修复建议供您参考。详情请参见健康中心概述
  • 监控中心:支持集群、节点、工作负载、Pod等多个层级的资源监控,并支持基于Prometheus的自定义集群监控能力。详情请参见监控中心概述
  • 日志中心:支持集群、应用日志采集、存储、查看,协助您排查和诊断问题。详情请参见日志中心概述
  • 告警中心:支持集群内的告警快速检索、告警快速配置的能力,可通过告警中心一键配置常用的告警规则。详情请参见告警中心概述

云原生成本中心

支持部门维度、集群维度、命名空间维度的成本和资源画像,并通过工作负载资源推荐等优化手段协助企业IT成本管理人员实现容器集群的提效降本诉求。详情请参见云原生成本治理概述

权限管理

支持IAM授权和命名空间授权(RBAC),详情请参见CCE权限概述
  • IAM授权:云服务层面的权限,用于管理CCE集群与周边资源(如VPC、ELB、ECS等)的操作。
  • 命名空间授权(RBAC):作用于集群内部,用于管理集群资源操作(如创建工作负载等),其中涉及周边云服务的集群资源(例如节点、负载均衡)需依赖对应云服务的IAM授权。

集群的网络

集群的网络可以分成三个部分:

  • 节点网络:为集群内节点分配IP地址。
  • 容器网络:为集群内容器分配IP地址,负责容器的通信,当前支持多种容器网络模型,不同模型有不同的工作机制。
  • 服务网络:服务(Service)是用来解决访问容器的Kubernetes对象,每个Service都有一个固定的IP地址。

在创建集群时,您需要为各个网络选择合适的网段,确保各网段之间不存在冲突,每个网段下有足够的IP地址可用。集群创建后不支持修改容器网络模型,您需要在创建前做好规划和选择。

强烈建议您在创建集群前详细了解集群的网络以及容器网络模型,具体请参见容器网络

集群控制节点数量与集群规模说明

在CCE集群中,集群规模和控制节点(Master节点)数量没有明显的关联,它们是属于不同的维度的集群参数。

  • 控制节点(Master节点)数量:在CCE中创建集群,您可以选择控制节点数量为1个或3个。如果集群的控制节点为3个,具备高可用能力,确保集群的可靠性。
  • 集群规模:创建集群时可以选择集群管理规模,表示集群支持管理的最大节点数量,例如50节点、200节点等。集群规模会影响控制节点规格,集群规模越大,控制节点的规格越高。

    集群规模可以在创建集群后变更,支持往大规模变更,但不支持往小规模变更,具体请参见变更集群规格

集群生命周期

表1 集群状态说明

状态

说明

创建中

集群正在创建,正在申请云资源

运行中

集群正常运行

休眠中

集群正在休眠中

唤醒中

集群正在唤醒中

升级中

集群正在升级中

变更中

集群正处于规格变更中

不可用

当前集群不可用

删除中

集群正在删除中

图1 集群状态流转