更新时间:2025-10-27 GMT+08:00
分享

产品功能

云容器引擎提供高度可扩展的、高性能的企业级Kubernetes集群,包括集群管理、节点管理、节点池管理、工作负载管理、容器网络、容器存储、弹性伸缩、应用调度、云原生观测、模板管理、插件管理、模板市场、权限管理等功能,为您提供一站式容器平台服务。

集群管理

云容器引擎CCE是一种托管的Kubernetes服务,可进一步简化基于容器的应用程序部署和管理,您可以在CCE中轻松创建Kubernetes集群、快速部署容器化应用,并高效地进行集群的管理与维护。

  • 一站式部署和运维:云容器引擎支持一键创建Kubernetes容器集群,省去了自行搭建Docker和Kubernetes集群的繁琐步骤。通过CCE,您可以通过云容器引擎自动化部署和一站式运维容器应用。

  • 支持多类型容器集群:您可以根据业务需要创建不同网络模型的CCE集群,并支持通过集群管理高性能的弹性云服务器、裸金属服务器、GPU加速云服务器等多种异构基础设施。
    表1 集群类型

    集群类型

    集群介绍

    发布区域

    CCE Turbo集群

    CCE Turbo集群是基于云原生基础设施构建的云原生2.0容器引擎服务,具备软硬协同、网络无损、安全可靠、调度智能的优势,为用户提供一站式、高性价比的全新容器服务体验。

    CCE Turbo集群提供了面向大规模高性能的场景云原生2.0网络,容器直接从VPC网段内分配IP地址,容器和节点可以分属不同子网,支持VPC内的外部网络与容器IP直通,享有高性能。

    • 亚太:华北-北京四、华北-乌兰察布一、华北三、华东-上海一、华东-青岛、华东二、华南-广州、华南-广州-友好用户环境、西南-贵阳一、中国-香港、亚太-曼谷、亚太-新加坡、亚太-雅加达、亚太-马尼拉
    • 中东:中东-利雅得
    • 非洲:非洲-开罗、非洲-约翰内斯堡
    • 土耳其:土耳其-伊斯坦布尔
    • 拉美:拉美-墨西哥城二、拉美-圣保罗一、拉美-圣地亚哥

    CCE Standard集群

    CCE Standard集群是云容器引擎服务的标准版本集群,提供商用级容器集群服务,并完全兼容开源Kubernetes 集群标准功能。

    CCE Standard集群为您提供简单、低成本、高可用的解决方案,无需管理和运维控制节点,并且可根据业务场景选择使用容器隧道网络模型或VPC网络模型,适合对性能和规模没有特殊要求的通用场景。

    全部区域

  • 集群管理功能:
    表2 集群管理功能介绍

    功能模块

    功能概述

    操作指南

    集群创建

    您可在CCE控制台创建Kubernetes集群,支持自定义配置容器网络、服务网络等相关配置参数,同时可选择创建集群时需要安装的插件。集群创建完成后,控制节点将由云容器引擎服务托管。

    购买Standard/Turbo集群

    连接集群

    您可通过kubectl或CloudShell等方式连接CCE集群,进而对集群进行管理和操作,如部署工作负载、查看资源状态等。

    连接集群概述

    集群升级

    CCE每年会固定发布若干个Kubernetes版本,并为每个版本提供2年的维护周期,建议您在维护周期结束前升级集群。升级集群可以降低安全和稳定性风险,支持新功能和新操作系统,避免大跨度兼容风险。

    升级集群概述

    集群休眠与唤醒

    当按需计费的集群暂时不用时,可将其休眠以节省成本。休眠后将暂停收取控制节点资源费用,但存储、负载均衡等相关资源仍按原计费方式收费。

    若要再次使用集群,可进行唤醒操作,唤醒过程可能需要3 - 5分钟。

    休眠/唤醒按需计费集群

    删除集群

    按需计费的集群可直接删除,包周期集群需进行退订或释放操作。删除集群可选择删除集群下的节点、工作负载与服务等,删除后相关业务无法恢复,操作前请确保数据已备份或迁移。

    删除集群

节点管理

节点是容器集群组成的基本元素。节点取决于业务,既可以是虚拟机,也可以是物理机。每个节点都包含运行Pod所需要的基本组件,包括 Kubelet、Kube-proxy 、Container Runtime等。在云容器引擎CCE中,主要采用高性能的弹性云服务器ECS或裸金属服务器BMS作为节点来构建高可用的Kubernetes集群。

表3 节点管理功能介绍

功能模块

功能概述

操作指南

创建节点

您可以在CCE中创建节点资源,这些节点主要基于弹性云服务器、裸金属服务器、GPU、NPU等资源,为Kubernetes集群中的应用提供稳定的运行基础。

创建节点

纳管已有节点到集群

您可以将已购买的弹性云服务器(ECS)、BMS(裸金属服务器)等资源加入到CCE集群中统一管理,提升了资源的复用率和管理的灵活性。

纳管节点

登录节点

您可以通过不同的方式访问节点,与节点直接交互,以便进行节点层面的问题排查等操作。

登录节点

管理节点标签

您可以根据业务需求(如节点用途、所属业务模块等)为节点添加、修改或删除标签,标签可用于后续工作负载调度(如将特定工作负载部署到带有指定标签的节点上),实现节点的精细化分类管理。

管理节点标签

管理节点污点

节点污点由键(key)、值(value)和效果(effect)组成,格式为 “key=value:effect”。它能够避免Pod调度到该节点上,而Pod可通过设置容忍度(Toleration)来匹配污点,从而允许被调度到带有相应污点的节点上

管理节点污点

同步云服务器

当节点在ECS侧的配置(如硬件参数、网络信息)或状态发生变化时,CCE支持手动触发节点信息同步,确保集群中显示的节点信息与实际节点状态一致,避免因信息不一致导致问题。

同步云服务器

节点排水

节点排水功能是一种用于安全驱逐节点上业务Pod的操作功能,主要用于节点维护、升级或缩容等场景,确保在对节点进行相关操作时,业务能够平滑迁移,不影响整体服务的可用性。

节点排水

重置节点

当节点出现配置错乱、软件故障等问题且难以通过常规方式修复时,可通过重置节点功能将节点恢复到初始状态(如清除节点上的非必要配置、重启相关组件等),快速恢复节点的可用状态。

在CCE集群中重置节点会将该节点以及节点内运行的业务都销毁,重置前请确认您的正常业务运行不受影响,请谨慎操作。

重置节点

删除节点

若节点不再需要参与集群运行(如业务缩减、节点老化淘汰),您可通过该功能将节点从集群中删除,同时释放节点资源。

在CCE集群中删除节点会将该节点以及节点内运行的业务都销毁,删除前请确认您的正常业务运行不受影响,请谨慎操作。

删除/退订节点

节点池管理

节点池是集群中用于管理节点的逻辑组合,可规范节点分组管理,实现特定的业务调度规则,支持节点的批量管理、弹性伸缩、节点迁移和配置复制等功能。您可以通过节点池实现资源的高效管理和优化,例如设置节点池的弹性伸缩策略以自动调整节点数量,满足业务需求。此外,节点池还支持配置Kubernetes参数,满足高级用户需求。

表4 节点池管理功能介绍

功能模块

功能概述

操作指南

创建节点池

您可以通过创建节点池时的参数配置节点模板,方便快捷地创建、管理和销毁节点。

创建节点池

修改节点核心组件配置

当集群默认的节点配置无法满足业务需求时,您可以在节点池维度上对节点的核心组件(如kubelet、kube-proxy、容器引擎等)进行深度配置。

在节点池维度修改节点核心组件配置

升级操作系统

当CCE发布新版本的操作系统镜像时,您可以手动将节点池中的节点进行批量重置升级。

升级操作系统

删除节点池

删除节点池会先删除节点池中的节点,节点删除后,原有节点上的工作负载实例会自动迁移至其他节点池的可用节点。

删除节点池

工作负载

工作负载是在Kubernetes上运行的应用程序。无论您的工作负载是单个组件还是协同工作的多个组件,您都可以在Kubernetes上的一组Pod中运行它。在Kubernetes中,工作负载是对一组Pod的抽象模型,用于描述业务的运行载体,包括DeploymentStatefulsetDaemonsetJobCronJob等多种类型。

CCE提供基于Kubernetes原生类型的容器部署和管理能力,支持容器工作负载部署、配置、监控、扩容、升级、卸载、服务发现及负载均衡等生命周期管理。

表5 工作负载功能介绍

功能模块

功能概述

操作指南

创建无状态负载(Deployment)

无状态负载(Deployment)是指在运行中不会保持任何数据或状态的应用,这些应用每个实例都是相同的,可以随时创建、销毁或替换,而不会影响应用的功能,非常适合一些不需要存储数据的应用,如Web前端服务器或一些微服务。

创建无状态负载(Deployment)

创建有状态负载(StatefulSet)

有状态负载(StatefulSet)是指那些在运行过程中需要保存数据或状态的应用,例如数据库、缓存服务、消息队列等。

创建有状态负载(StatefulSet)

创建守护进程集(DaemonSet)

守护进程集(DaemonSet)是Kubernetes提供的工作负载类型之一,它可以确保全部(或者某些)节点上始终运行着一个Pod实例。一旦有新的节点加入集群,DaemonSet控制器就会自动在这个新节点上创建一个新的Pod。反之,当某个节点从集群中移除时,该节点上的Pod会被自动清理掉。

创建守护进程集(DaemonSet)

创建普通任务(Job)

普通任务(Job)是Kubernetes中用于管理批处理任务的工作负载,通常用于执行一次性或有限次的短任务。不同于长期运行的业务(如通过Deployment或StatefulSet管理的业务),Job会创建一个或者多个Pod,这些Pod具有明确的开始和结束阶段,如果Job没有达到指定的任务目标,它将继续重试执行Pod,直到达到目标。

创建普通任务(Job)

创建定时任务(CronJob)

定时任务(CronJob)是Kubernetes中用于定期执行任务的一种工作负载,类似于Linux系统的crontab,使用Cron格式进行编写, 并周期性地在给定的调度时间执行Job。

创建定时任务(CronJob)

设置容器规格

支持在创建工作负载时为添加的容器设置资源限制。可以对工作负载中每个实例所用的CPU配额、内存配额进行申请和限制,对每个实例所用的GPU和NPU配额设置使用或不使用。

设置容器规格

设置容器生命周期

容器生命周期函数是Kubernetes提供的核心机制,用于在容器运行的关键阶段插入自定义逻辑。这些函数为容器化应用提供了精细化的过程控制能力,使应用能够更好地适应云原生环境的动态特性。

设置容器生命周期

设置容器健康检查

健康检查是指容器运行过程中,根据用户需要,定时检查容器健康状况。若未配置健康检查机制,当容器内的应用程序发生异常时,Pod无法感知该异常,也不会自动执行重启操作进行恢复。这样可能导致Pod状态显示为“运行中”,但实际上容器内的应用已处于不可用或异常状态。

Kubernetes提供了三种健康检查探针,监测容器中应用的运行状态,以确保系统的稳定性和高可用性。

设置容器健康检查

设置环境变量

容器环境变量是运行容器时动态传入的配置参数,允许在不重新构建镜像的情况下,灵活调整应用的行为和设置。

设置环境变量

网络访问

云容器引擎通过将Kubernetes网络和VPC深度集成,提供了稳定高性能的网络访问方式,能够满足多种复杂场景下工作负载间的互相访问。

表6 网络管理功能介绍

功能模块

功能概述

操作指南

服务(Service)

Service是一种资源,提供了访问单个或多个容器应用的能力。每个服务在其生命周期内,都拥有一个固定的IP地址和端口。每个服务对应了后台的一个或多个Pod,通过这种方式,客户端就不需要关心Pod所在的位置,方便后端进行Pod扩容、缩容等操作。

支持的Service类型包括:

  • 集群内访问(ClusterIP):仅在集群内访问服务。
  • 节点访问(NodePort):使用节点私有IP或弹性公网IP访问。
  • 负载均衡(LoadBalancer):使用弹性负载均衡器访问服务。
  • DNAT网关(DNAT):通过DNAT网关访问服务。

服务概述

路由(Ingress)

路由(Ingress)是Kubernetes集群中一种独立的资源,制定了集群外部访问流量的转发规则。您可根据域名和路径对转发规则进行自定义,完成对访问流量的细粒度划分。

路由概述

容器存储

容器存储功能基于Kubernetes容器存储接口(CSI),并深度融合华为云存储服务,如云硬盘EVS、文件存储SFS和对象存储OBS等,并完全兼容Kubernetes原生的存储服务,例如EmptyDir、HostPath、Secret和ConfigMap等存储。

表7 存储管理功能介绍

功能模块

功能概述

操作指南

云硬盘存储卷

CCE支持将云硬盘(EVS)挂载到容器中。通过云硬盘,可以将存储系统的远端文件目录挂载到容器中,数据卷中的数据将被永久保存,即使删除了容器,数据卷中的数据依然保存在存储系统中。

云硬盘概述

文件存储卷

CCE支持将弹性文件存储(SFS)创建的存储卷挂载到容器的某一路径下,以满足数据持久化需求,SFS存储卷适用于多读多写的持久化存储,适用大容量扩展以及成本敏感型的业务场景,包括媒体处理、内容管理、大数据分析和分析工作负载程序等。

文件存储概述

极速文件存储卷

CCE支持创建SFS Turbo极速文件存储卷并挂载到容器的某一路径下,极速文件存储具有按需申请,快速供给,弹性扩展,方便灵活等特点,适用于DevOps、容器微服务、企业办公等应用场景。

极速文件存储概述

对象存储卷

对象存储服务(Object Storage Service,OBS)提供海量、安全、高可靠、低成本的数据存储能力,可供用户存储任意类型和大小的数据。适合企业备份/归档、视频点播、视频监控等多种数据存储场景。CCE支持创建OBS对象存储卷并挂载到容器的某一路径下。

对象存储概述

专属存储

专属分布式存储服务(Dedicated Distributed Storage Service,DSS)可以为您提供独享的物理存储资源,通过数据冗余和缓存加速等多项技术,提供高可用性和持久性,以及稳定的低时延性能。CCE支持将使用DSS创建的存储卷挂载到容器。

专属存储概述

本地持久卷

CCE支持使用LVM将节点上的数据卷组成存储池(VolumeGroup),然后划分LV给容器挂载使用。使用本地持久卷作为存储介质的PV的类型可称之为Local PV。

本地持久卷概述

临时存储卷

CCE提供了如下两种EmptyDir类型:

  • 临时路径:Kubernetes原生的EmptyDir类型,生命周期与容器实例相同,并支持指定内存作为存储介质。容器实例消亡时,EmptyDir会被删除,数据会永久丢失。
  • 本地临时卷:本地临时存储卷将节点的本地数据盘通过LVM组成存储池(VolumeGroup),然后划分LV作为EmptyDir的存储介质给容器挂载使用,相比原生EmptyDir默认的存储介质类型性能更好。

临时存储卷概述

弹性伸缩

CCE支持集群节点、工作负载的弹性伸缩,支持手动伸缩和自动弹性伸缩,并可以自由组合多种弹性策略以应对业务高峰期的突发流量浪涌。

表8 弹性伸缩功能介绍

功能模块

功能概述

操作指南

工作负载伸缩

集群调度层的弹性伸缩,作用于Pod,通过调整Pod的数量或规格来适配负载变化。例如,通过HPA在高峰时段自动增加Pod数量,处理更多用户请求;在低谷时段自动减少Pod数量,节约资源。

工作负载伸缩原理

节点伸缩

集群资源层的弹性伸缩,支持根据Pod的资源调度情况,动态增加或减少计算资源(如ECS或CCI等),确保集群在高负载情况下拥有足够的资源,同时在低负载时期减少资源浪费。

节点伸缩原理

应用调度

CCE基于Volcano调度器提供多元算力资源调度及任务调度的能力,面向机器学习、深度学习、生物信息学、基因组学及其他大数据应用场景提供完整的应用调度特性。

CCE支持CPU资源调度、GPU/NPU异构资源调度、在离线作业混合部署、CPU Burst弹性限流等调度策略,您可以根据业务特征设置调度策略,帮助您提升应用的性能和集群整体资源的利用率。

表9 应用调度功能介绍

功能模块

功能概述

操作指南

CPU调度

CCE提供CPU管理策略,可为应用分配完整的物理CPU核,从而提升性能并降低调度延迟。

CPU调度

GPU调度

CCE为集群中的GPU异构资源提供调度能力,从而实现资源的精细化分配与高效利用,满足不同类型工作负载对GPU算力的差异化需求,提升整体集群的调度效率与业务运行性能。

GPU调度

NPU调度

CCE为集群中的NPU异构资源提供调度能力,从而实现对推理和图像识别等工作的高效处理。

NPU调度

Volcano调度

Volcano是一个基于Kubernetes的批处理平台,提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性,提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。

Volcano调度概述

云原生混部

云原生混部解决方案围绕Volcano和Kubernetes生态,帮助用户提升资源利用率,实现降本增效。

云原生混部概述

云原生观测

CCE支持灵活配置工作负载日志策略,不仅能实现日志的统一收集、集中管理与深度分析,还可按周期进行防爆处理。

在监控能力上,CCE可对集群节点与工作负载的资源水位、运行状态、网络流量等关键指标进行全方位覆盖,并且提供了直观的可视化视图,支持多级下钻查询与关联分析,帮助用户快速定位问题。

此外,CCE支持告警与事件的自动上报,用户通过预设的告警模板,可一键开启实时监测功能,及时发现集群与容器的潜在故障,保障业务稳定运行。

表10 云原生观测功能介绍

功能模块

功能概述

操作指南

健康中心

集群健康诊断基于容器运维专家经验对集群健康状况进行全面检查,能够及时发现集群故障与潜在风险并给出修复建议。

健康中心概述

监控中心

监控中心提供不同维度的数据洞察、仪表盘等功能。监控中心提供容器视角的可视化视图,支持集群、节点、工作负载和Pod等多种维度的监控视图,支持多级下钻与关联分析。仪表盘功能内置常见的容器监控大盘,如Kubernetes APIServer组件监控、CoreDNS组件监控和PVC监控等。

监控中心概述

日志中心

CCE日志中心集成了云日志服务LTS。启用日志采集与管理,您可以快速采集CCE控制面组件日志(kube-apiserver、kube-controller-manager、kube-scheduler)、kubernetes审计日志、Kubernetes事件和容器日志(容器的标准输出、容器内的文本文件、节点日志)。

日志中心概述

告警中心

告警中心集成应用运维管理服务AOM2.0的告警功能,提供容器告警一键开启能力,覆盖集群和容器常见故障场景。

告警中心概述

模板管理

CCE基于Kubernetes Helm标准的模板提供统一的资源管理与调度,高效地实现了模板的快速部署与后期管理,大幅简化了Kubernetes资源的安装管理过程。对于应用发布者而言,可以通过Helm打包应用、管理应用依赖关系、管理应用版本并发布应用到软件仓库。对于使用者而言,使用Helm后不用需要编写复杂的应用部署文件,可以以简单的方式在Kubernetes上查找、安装、升级、回滚、卸载应用程序。

表11 模板管理功能介绍

功能模块

功能概述

操作指南

通过模板部署应用

您可以上传Helm模板包,然后在控制台安装部署,并对部署的实例进行管理。

通过模板部署应用

插件管理

CCE提供了多种类型的插件,用于管理集群的扩展功能,支持用户根据特定需求进行选择性扩展,从而增强容器化应用环境的功能和灵活性。

这些插件既包括CCE自研/增强的插件,也涵盖了广泛使用的开源插件。

  • CCE自研/增强插件与CCE平台深度集成,针对特定的业务需求和场景进行了优化,能够更好地支持复杂的企业级应用,确保高性能和高可靠性。
  • 开源插件则利用广泛的社区支持和成熟的技术,为用户提供丰富的功能选择和灵活的解决方案,满足不断变化的业务需求。

详情请参见插件概述

权限管理

权限管理是在统一身份认证服务(IAM)与Kubernetes的角色访问控制(RBAC)的能力基础上,打造的细粒度权限管理功能,该功能不仅支持基于IAM的细粒度权限控制和IAM Token认证,还支持集群级别、命名空间级别的权限控制,帮助用户便捷灵活地对租户下的IAM用户、用户组设定不同的操作权限,满足不同场景下的权限管理需求。

表12 权限管理功能介绍

功能模块

功能概述

操作指南

集群权限

CCE集群权限是基于统一身份认证服务(IAM)实现的细粒度授权管理功能,涉及云服务层面的权限,拥有指定IAM权限的用户或用户组可对CCE涉及到的云服务资源进行操作,例如集群创建、删除等。

集群权限(IAM授权)

命名空间权限

基于Kubernetes RBAC能力的授权,涉及集群内部的资源操作权限,通过RBAC权限设置可以让不同的用户或用户组拥有操作不同Kubernetes资源(如Pod、Service、ConfigMap等)的权限。

命名空间权限(Kubernetes RBAC授权)

相关文档