云容器引擎 CCE
云容器引擎 CCE
Standard/Turbo集群
Autopilot集群
本产品内“
”的所有结果
Standard/Turbo集群
Autopilot集群
本产品内“
”的所有结果
最新动态
功能总览
服务公告
最新公告
产品变更公告
关于CentOS停止维护的通知
华为云容器服务CCE Autopilot数据面账单变更公告
华为云容器服务CCE Autopilot于2024年9月30日00:00(北京时间)转商
集群网络、存储功能可靠性加固说明
关于CCE集群Docker支持策略公告
ServiceAccount Token安全性提升说明
Helm V2 升级Helm V3 公告
CCE集群IPVS转发模式下conn_reuse_mode问题说明
Everest插件优化密钥认证功能公告
集群版本公告
1.23版本集群停止维护公告
1.21版本集群停止维护公告
1.19版本集群停止维护公告
1.17版本集群停止维护公告
1.15版本集群停止维护公告
1.13版本集群停止维护公告
CCE不再支持1.13及之前版本集群的创建公告
Kubernetes 1.9的集群版本升级公告
漏洞公告
漏洞修复策略
NVIDIA Container Toolkit容器逃逸漏洞公告(CVE-2024-0132)
Linux CUPS服务RCE 漏洞公告(CVE-2024-47076、CVE-2024-47175、CVE-2024-47176、CVE-2024-47177)
NGINX Ingress控制器验证绕过漏洞公告(CVE-2024-7646)
Docker Engine授权插件AuthZ权限绕过漏洞公告(CVE-2024-41110)
Linux内核权限提升漏洞公告(CVE-2024-1086)
OpenSSH远程代码执行漏洞公告(CVE-2024-6387)
Fluent Bit内存崩溃漏洞公告(CVE-2024-4323)
runc systemd属性注入漏洞公告(CVE-2024-3154)
runc漏洞(CVE-2024-21626)对CCE服务的影响说明
Kubernetes安全漏洞公告(CVE-2022-3172)
Linux Kernel openvswitch 模块权限提升漏洞预警(CVE-2022-2639)
nginx-ingress插件安全漏洞预警公告(CVE-2021-25748)
nginx-ingress插件安全漏洞预警公告(CVE-2021-25745,CVE-2021-25746)
containerd容器进程权限提升漏洞公告(CVE-2022-24769)
CRI-O容器运行时引擎任意代码执行漏洞(CVE-2022-0811)
linux内核导致的容器逃逸漏洞公告(CVE-2022-0492)
containerd镜像Volume非安全处理漏洞公告(CVE-2022-23648)
Linux内核整数溢出漏洞(CVE-2022-0185)
Linux Polkit 权限提升漏洞预警(CVE-2021-4034)
Kubernetes subpath符号链接交换安全漏洞(CVE-2021- 25741)
runc符号链接挂载与容器逃逸漏洞预警公告(CVE-2021-30465)
Docker资源管理错误漏洞公告(CVE-2021-21285)
NVIDIA GPU驱动漏洞公告(CVE-2021-1056)
Sudo缓冲区错误漏洞公告(CVE-2021-3156)
Kubernetes安全漏洞公告(CVE-2020-8554)
Apache containerd安全漏洞公告(CVE-2020-15257)
Docker Engine输入验证错误漏洞公告(CVE-2020-13401)
Kubernetes kube-apiserver输入验证错误漏洞公告(CVE-2020-8559)
Kubernetes kubelet资源管理错误漏洞公告(CVE-2020-8557)
Kubernetes kubelet和kube-proxy授权问题漏洞公告(CVE-2020-8558)
修复Kubernetes HTTP/2漏洞公告
修复Linux内核SACK漏洞公告
修复Docker操作系统命令注入漏洞公告(CVE-2019-5736)
全面修复Kubernetes权限许可和访问控制漏洞公告(CVE-2018-1002105)
修复Kubernetes Dashboard安全漏洞公告(CVE-2018-18264)
产品发布记录
集群版本发布记录
Kubernetes版本策略
Kubernetes版本发布记录
Kubernetes 1.30版本说明
Kubernetes 1.29版本说明
Kubernetes 1.28版本说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
(停止维护)Kubernetes 1.21版本说明
(停止维护)Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
(停止维护)Kubernetes 1.15版本说明
(停止维护)Kubernetes 1.13版本说明
(停止维护)Kubernetes 1.11版本说明
(停止维护)Kubernetes 1.9及之前版本说明
补丁版本发布记录
操作系统镜像发布记录
操作系统版本支持机制
操作系统镜像版本说明
插件版本发布记录
CoreDNS域名解析插件版本发布记录
CCE容器存储插件(Everest)版本发布记录
CCE节点故障检测插件版本发布记录
Kubernetes Dashboard插件版本发布记录
CCE集群弹性引擎版本发布记录
NGINX Ingress控制器插件版本发布记录
Kubernetes Metrics Server插件版本发布记录
CCE容器弹性引擎插件版本发布记录
CCE突发弹性引擎(对接CCI)插件版本发布记录
CCE AI套件(NVIDIA GPU)版本发布记录
CCE AI套件(Ascend NPU)版本发布记录
Volcano调度器版本发布记录
CCE密钥管理(对接 DEW)插件版本发布记录
CCE容器网络扩展指标插件版本发布记录
节点本地域名解析加速插件版本发布记录
云原生监控插件版本发布记录
云原生日志采集插件版本发布记录
容器镜像签名验证插件版本发布记录
Grafana插件版本发布记录
OpenKruise插件版本发布记录
Gatekeeper插件版本发布记录
容器垂直弹性引擎版本发布记录
CCE集群备份恢复插件版本发布记录(停止维护)
Kubernetes Web终端版本发布记录(停止维护)
Prometheus插件版本发布记录(停止维护)
产品介绍
图解云容器引擎
什么是云容器引擎
产品优势
应用场景
容器应用管理
秒级弹性伸缩
微服务流量治理
DevOps持续交付
混合云
高性能调度
安全
责任共担
数据保护技术
审计与日志
监控安全风险
认证证书
权限管理
约束与限制
计费说明
与其它云服务的关系
区域与可用区
计费说明
计费概述
计费项
计费模式
计费模式概述
包年/包月
按需计费
计费样例
变更规格
变更计费模式
变更计费模式概述
按需转包年/包月
包年/包月转按需
续费
续费概述
手动续费
自动续费
费用账单
欠费说明
停止计费
计费FAQ
Kubernetes基础知识
概述
基本概念
容器与Kubernetes
容器
Kubernetes
使用Kubectl命令操作集群
Pod、Label和Namespace
Pod:Kubernetes中的最小调度对象
存活探针(Liveness Probe)
Label:组织Pod的利器
Namespace:资源分组
Pod的编排与调度
无状态负载(Deployment)
有状态负载(StatefulSet)
普通任务(Job)和定时任务(CronJob)
守护进程集(DaemonSet)
亲和与反亲和调度
配置管理
ConfigMap
Secret
Kubernetes网络
容器网络
Service
Ingress
就绪探针(Readiness Probe)
NetworkPolicy
持久化存储
Volume
PV、PVC和StorageClass
认证与授权
ServiceAccount
RBAC
弹性伸缩
快速入门
在CCE集群中部署NGINX无状态工作负载
在CCE集群中部署WordPress有状态工作负载
在CCE集群中通过Helm模板部署应用程序
用户指南
高危操作一览
集群
集群概述
集群基本信息
Kubernetes版本发布记录
Kubernetes 1.30版本说明
Kubernetes 1.29版本说明
Kubernetes 1.28版本说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
(停止维护)Kubernetes 1.21版本说明
(停止维护)Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
(停止维护)Kubernetes 1.15版本说明
(停止维护)Kubernetes 1.13版本说明
(停止维护)Kubernetes 1.11版本说明
(停止维护)Kubernetes 1.9及之前版本说明
补丁版本发布记录
购买集群
集群类型对比
购买Standard/Turbo集群
在CCE Turbo集群中使用分布式云资源
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过CloudShell连接集群
通过X509证书连接集群
通过自定义域名访问集群
吊销集群访问凭证
管理集群
修改CCE集群配置
开启集群过载控制
变更集群规格
更改集群节点的默认安全组
删除集群
休眠/唤醒按需计费集群
续费包年/包月集群
按需计费集群转包周期
升级集群
升级集群的流程和方法
升级前须知
升级后验证
集群状态检查
节点状态检查
跳过节点检查
业务检查
新建节点检查
新建Pod检查
集群跨版本业务迁移
升级前检查异常问题排查
升级前检查项
节点限制检查异常处理
升级管控检查异常处理
插件检查异常处理
Helm模板检查异常处理
Master节点SSH连通性检查异常处理
节点池检查异常处理
安全组检查异常处理
残留待迁移节点检查异常处理
K8s废弃资源检查异常处理
兼容性风险检查异常处理
节点CCE Agent版本检查异常处理
节点CPU使用率检查异常处理
CRD检查异常处理
节点磁盘检查异常处理
节点DNS检查异常处理
节点关键目录文件权限检查异常处理
节点Kubelet检查异常处理
节点内存检查异常处理
节点时钟同步服务器检查异常处理
节点OS检查异常处理
节点CPU数量检查异常处理
节点Python命令检查异常处理
ASM网格版本检查异常处理
节点Ready检查异常处理
节点journald检查异常处理
节点干扰ContainerdSock检查异常处理
内部错误异常处理
节点挂载点检查异常处理
K8s节点污点检查异常处理
everest插件版本限制检查异常处理
cce-hpa-controller插件限制检查异常处理
增强型CPU管理策略检查异常处理
用户节点组件健康检查异常处理
控制节点组件健康检查异常处理
K8s组件内存资源限制检查异常处理
K8s废弃API检查异常处理
节点NetworkManager检查异常处理
节点ID文件检查异常处理
节点配置一致性检查异常处理
节点配置文件检查异常处理
CoreDNS配置一致性检查异常处理
节点Sudo检查异常处理
节点关键命令检查异常处理
节点sock文件挂载检查异常处理
HTTPS类型负载均衡证书一致性检查异常处理
节点挂载检查异常处理
节点paas用户登录权限检查异常处理
ELB IPv4私网地址检查异常处理
检查历史升级记录是否满足升级条件
检查集群管理平面网段是否与主干配置一致
GPU插件检查异常处理
节点系统参数检查异常处理
残留packageversion检查异常处理
节点命令行检查异常处理
节点交换区检查异常处理
nginx-ingress插件升级检查异常处理
云原生监控插件升级检查异常处理
Containerd Pod重启风险检查异常处理
GPU插件关键参数检查异常处理
GPU/NPU Pod重建风险检查异常处理
ELB监听器访问控制配置项检查异常处理
Master节点规格检查异常处理
Master节点子网配额检查异常处理
节点运行时检查异常处理
节点池运行时检查异常处理
检查节点镜像数量异常处理
OpenKruise插件兼容性检查异常处理
Secret落盘加密特性兼容性检查异常处理
Ubuntu内核与GPU驱动兼容性提醒
排水任务检查异常处理
节点镜像层数量异常检查
检查集群是否满足滚动升级条件
轮转证书文件数量检查
Ingress与ELB配置一致性检查
节点
节点概述
容器引擎说明
节点操作系统说明
节点规格说明
创建节点
纳管节点
登录节点
管理节点
管理节点标签
管理节点污点
重置节点
移除节点
同步云服务器
节点排水
删除/退订节点
按需节点转包年/包月
包年/包月节点修改自动续费配置
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
默认数据盘空间分配说明
节点可创建的最大Pod数量说明
CCE节点kubelet和runtime组件路径与社区原生配置差异说明
将节点容器引擎从Docker迁移到Containerd
节点系统参数优化
可优化的节点系统参数列表
修改节点日志缓存内存占用量上限RuntimeMaxUse
修改最大文件句柄数
修改节点内核参数
修改节点进程 ID数量上限kernel.pid_max
配置节点故障检测策略
创建节点时执行安装前/后脚本
节点池
节点池概述
新版节点池切换说明
创建节点池
扩缩容节点池
管理节点池
更新节点池
更新弹性伸缩配置
修改节点池配置
纳管节点至节点池
复制节点池
同步节点池
升级操作系统
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
配置工作负载
安全运行时与普通运行时
设置时区同步
设置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
设置性能管理配置
设置工作负载升级策略
设置容忍策略
设置标签与注解
调度工作负载
工作负载调度策略概述
设置指定节点调度(nodeSelector)
设置节点亲和调度(nodeAffinity)
设置工作负载亲和/反亲和调度(podAffinity/podAntiAffinity)
登录容器实例
管理工作负载
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
调度
调度概述
CPU调度
CPU管理策略
增强型CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
GPU虚拟化
GPU虚拟化概述
准备GPU虚拟化资源
使用GPU虚拟化
兼容Kubernetes默认GPU调度模式
监控GPU资源指标
基于GPU监控指标的工作负载弹性伸缩配置
GPU故障处理
NPU调度
Volcano调度
Volcano调度概述
使用Volcano调度工作负载
资源利用率优化调度
装箱调度(Binpack)
重调度(Descheduler)
节点池亲和性调度
负载感知调度
资源利用率优化调度配置案例
业务优先级保障调度
优先级调度与抢占
AI任务性能增强调度
公平调度(DRF)
组调度(Gang)
NUMA亲和性调度
应用扩缩容优先级策略
云原生混部
云原生混部概述
开启云原生混部
动态资源超卖
基于Pod实例画像的资源超卖
CPU Burst弹性限流
出口网络带宽保障
网络
网络概述
容器网络
容器网络模型对比
云原生网络2.0模型
云原生网络2.0模型说明
配置集群容器子网
使用注解为Pod绑定安全组
使用安全组策略为工作负载绑定安全组
使用容器网络配置为命名空间/工作负载绑定子网及安全组
为Pod配置固定IP
为Pod配置EIP
为Pod配置固定EIP
为IPv6双栈网卡的Pod配置共享带宽
VPC网络模型
VPC网络模型说明
扩展集群容器网段
容器隧道网络模型
容器隧道网络模型说明
Pod网络配置
在Pod中配置主机网络(hostNetwork)
为Pod配置QoS
配置网络策略(NetworkPolicy)限制Pod访问的对象
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡类型的服务
为负载均衡类型的Service配置HTTP/HTTPS协议
为负载均衡类型的Service配置服务器名称指示(SNI)
为负载均衡类型的Service配置HTTP/2
为负载均衡类型的Service配置HTTP/HTTPS头字段
为负载均衡类型的Service配置超时时间
为负载均衡类型的Service配置TLS
为负载均衡类型的Service配置gzip数据压缩
为负载均衡类型的Service配置黑名单/白名单访问策略
为负载均衡类型的Service指定多个端口配置健康检查
为负载均衡类型的Service配置pass-through能力
为负载均衡类型的Service配置获取客户端IP
为负载均衡类型的Service配置自定义EIP
为负载均衡类型的Service配置区间端口监听
通过ELB健康检查设置Pod就绪状态
健康检查使用UDP协议的安全组规则说明
DNAT网关(DNAT)
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
用于配置ELB Ingress的注解(Annotations)
ELB Ingress高级配置示例
为ELB Ingress配置HTTPS证书
更新ELB Ingress的HTTPS证书
为ELB Ingress配置服务器名称指示(SNI)
为ELB Ingress配置多个转发策略
为ELB Ingress配置HTTP/2
为ELB Ingress配置HTTPS协议的后端服务
为ELB Ingress配置GRPC协议的后端服务
为ELB Ingress配置超时时间
为ELB Ingress配置慢启动持续时间
为ELB Ingress配置灰度发布
为ELB Ingress配置黑名单/白名单访问策略
为ELB Ingress配置多个监听端口
为ELB Ingress配置HTTP/HTTPS头字段
为ELB Ingress配置gzip数据压缩
为ELB Ingress配置URL重定向
为ELB Ingress配置Rewrite重写
为ELB Ingress配置HTTP重定向到HTTPS
为ELB Ingress配置转发规则优先级
为ELB Ingress配置自定义Header转发策略
为ELB Ingress配置自定义EIP
为ELB Ingress配置跨域访问
为ELB Ingress配置写入/删除Header
为ELB Ingress配置高级转发规则
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
用于配置Nginx Ingress的注解(Annotations)
Nginx Ingress高级配置示例
为Nginx Ingress配置HTTPS证书
为Nginx Ingress配置重定向规则
为Nginx Ingress配置URL重写规则
为Nginx Ingress配置HTTPS协议的后端服务
为Nginx Ingress配置一致性哈希负载均衡
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
使用NodeLocal DNSCache提升DNS性能
集群网络配置
扩展集群VPC网段
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
在有状态负载中动态挂载云硬盘存储
快照与备份
文件存储(SFS)
文件存储概述
通过静态存储卷使用已有文件存储
通过动态存储卷使用文件存储
通过动态存储卷创建SFS子目录
设置文件存储挂载参数
将容器应用从SFS 1.0迁移到通用文件系统(SFS 3.0)或SFS Turbo
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
通过动态存储卷创建SFS Turbo子目录(推荐)
通过StorageClass动态创建SFS Turbo子目录
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
跨区域使用OBS桶
专属存储(DSS)
专属存储概述
通过静态存储卷使用专属存储
通过动态存储卷使用专属存储
在有状态负载中动态挂载专属存储
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
在有状态负载中动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
可观测性体系概述
健康中心
健康中心概述
使用健康中心
诊断项及修复方案
监控中心
监控中心概述
开通监控中心
管理监控采集任务
集群监控
节点监控
工作负载监控
Pod监控
事件监控
仪表盘
使用仪表盘
集群视图
APIServer视图
Pod视图
主机视图
Node视图
节点池视图
GPU视图
XGPU视图
CoreDNS视图
PVC视图
Kubelet视图
Prometheus Server视图
Prometheus Agent视图
日志中心
日志中心概述
收集容器日志
通过云原生日志采集插件采集容器日志
通过ICAgent采集容器日志(不推荐)
采集Kubernetes事件
采集NGINX Ingress访问日志
采集控制面组件日志
采集Kubernetes审计日志
告警中心
告警中心概述
通过告警中心一键配置告警
通过CCE配置自定义告警
通过AOM配置自定义告警
CCE事件列表
日志审计
云审计服务支持的CCE操作列表
在CTS事件列表查看云审计事件
可观测性FAQ
计费相关FAQ
监控中心FAQ
日志中心FAQ
告警中心FAQ
可观测性最佳实践
云原生监控插件兼容自建Prometheus
使用云原生监控插件监控自定义指标
使用AOM监控自定义指标
使用Prometheus监控Master节点组件指标
监控NGINX Ingress控制器指标
监控CCE Turbo集群容器网络扩展指标
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
创建HPA策略
创建使用自定义指标的HPA策略
创建CronHPA定时策略
创建CustomedHPA策略
创建VPA策略
创建AHPA策略
管理工作负载弹性伸缩策略
节点弹性伸缩
节点伸缩原理
节点池弹性伸缩优先级说明
创建节点弹性策略
管理节点弹性策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
CCE容器实例弹性伸缩到CCI服务
云原生成本治理
云原生成本治理概述
成本洞察
成本洞察概述
成本计算模型
开通成本洞察
Region视角的成本洞察
单部门视角的成本洞察
单集群视角的成本洞察
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
插件
插件概述
容器调度与弹性插件
Volcano调度器
CCE集群弹性引擎
CCE容器弹性引擎
CCE突发弹性引擎(对接CCI)
容器垂直弹性引擎
云原生可观测性插件
云原生监控插件
云原生日志采集插件
CCE节点故障检测
CCE容器网络扩展指标
Kubernetes Metrics Server
Grafana
Prometheus(停止维护)
云原生异构计算插件
CCE AI套件(NVIDIA GPU)
CCE AI套件(Ascend NPU)
容器网络插件
CoreDNS域名解析
NGINX Ingress控制器
节点本地域名解析加速
容器存储插件
CCE容器存储(Everest)
CCE容器存储(Flexvolume,已废弃)
容器安全插件
CCE密钥管理(对接 DEW)
容器镜像签名验证
其他插件
Kubernetes Dashboard
OpenKruise
Gatekeeper
CCE集群备份恢复(停止维护)
Kubernetes Web终端(停止维护)
模板(Helm Chart)
模板概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
ServiceAccount Token安全性提升说明
系统委托说明
配置中心
集群配置概览
集群访问配置
网络配置
调度配置
集群弹性伸缩配置
监控运维配置
Kubernetes原生配置
异构资源配置
存储管理-Flexvolume(已弃用)
存储Flexvolume概述
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型
云硬盘存储卷
云硬盘存储卷概述
使用kubectl自动创建云硬盘
使用kubectl对接已有云硬盘
使用kubectl部署带云硬盘存储卷的工作负载
极速文件存储卷
极速文件存储卷概述
使用kubectl对接已有极速文件存储卷
使用kubectl部署带极速文件存储卷的无状态工作负载
使用kubectl部署带极速文件存储卷的有状态工作负载
对象存储卷
对象存储卷概述
使用kubectl自动创建对象存储
使用kubectl对接已有对象存储
使用kubectl部署带对象存储卷的无状态工作负载
使用kubectl部署带对象存储卷的有状态工作负载
文件存储卷
文件存储卷概述
使用kubectl自动创建文件存储
使用kubectl对接已有文件存储
使用kubectl部署带文件存储卷的无状态工作负载
使用kubectl部署带文件存储卷的有状态工作负载
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
应用容器化改造方案概述
资源与成本规划
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
迁移
容器镜像迁移
容器镜像迁移方案概述
使用docker命令将镜像迁移至SWR
使用image-migrator将镜像迁移至SWR
跨云Harbor同步镜像至华为云SWR
将K8s集群迁移到CCE
自建K8s集群迁移方案概述
目标集群资源规划
实施步骤
集群外资源迁移
迁移工具安装
集群内资源迁移(Velero)
资源更新适配
其余工作
异常排查及解决
DevOps
在CCE中安装部署Jenkins
在CCE中安装部署Jenkins方案概述
资源和成本规划
实施步骤
Jenkins Master安装部署
Jenkins Agent配置
使用Jenkins构建流水线
参考:Jenkins对接Kubernetes集群的RBAC
Gitlab对接SWR和CCE执行CI/CD
使用Argo CD实现持续交付
容灾
CCE集群高可用推荐配置
在CCE中实现应用高可用部署
插件高可用部署
安全
安全配置概述
CCE集群安全配置建议
CCE节点安全配置建议
CCE容器运行时的安全配置建议
在CCE集群中使用容器的安全配置建议
在CCE集群中使用镜像服务的安全配置建议
在CCE集群中使用密钥Secret的安全配置建议
在CCE集群中使用工作负载Identity的安全配置建议
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
CCE容器实例弹性伸缩到CCI服务
基于ELB监控指标的弹性伸缩实践
监控
使用Prometheus监控多个集群
使用dcgm-exporter监控GPU指标
将Prometheus监控数据上报至第三方监控平台
集群
CCE集群选型建议
通过CCE搭建IPv4/IPv6双栈集群
制作CCE节点自定义镜像
创建节点时执行安装前/后脚本
创建节点时使用OBS桶实现自定义脚本注入
通过kubectl对接多个集群
选择合适的节点数据盘大小
集群视角的成本可视化最佳实践
使用共享VPC创建CCE Turbo集群
集群过载保护最佳实践
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
CCE集群实现访问跨VPC网络通信
使用VPC和云专线实现容器与IDC之间的网络通信
自建IDC与CCE集群共享域名解析
自建IDC与CCE集群共享域名解析方案概述
通过DNS Endpoint做级联解析
修改CoreDNS配置直接解析
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
通过配置容器内核参数增大监听队列长度
为负载均衡类型的Service配置pass-through能力
从Pod访问集群外部网络
从Pod访问公网
从Pod访问同一VPC网络的云服务
从Pod访问不同VPC网络的云服务
通过模板包部署Nginx Ingress Controller
自定义部署Nginx Ingress Controller
Nginx Ingress Controller高级配置
CoreDNS配置优化实践
CoreDNS配置优化概述
客户端
优化域名解析请求
选择合适的镜像
避免IPVS缺陷导致的DNS概率性解析超时
使用节点DNS缓存NodeLocal DNSCache
及时升级集群中的CoreDNS版本
谨慎调整VPC和虚拟机的DNS配置
服务端
监控CoreDNS运行状态
调整CoreDNS部署状态
合理配置CoreDNS
CCE Turbo配置容器网卡动态预热
集群通过企业路由器连接对端VPC
在VPC网络集群中访问集群外地址时使用Pod IP作为客户端源IP
存储
存储扩容
跨账号挂载对象存储
通过StorageClass动态创建SFS Turbo子目录
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型
自定义StorageClass
使用延迟绑定的云硬盘(csi-disk-topology)实现跨AZ调度
容器
合理分配容器计算资源
升级实例过程中实现业务不中断
通过特权容器功能优化内核参数
使用Init容器初始化应用
容器与节点时区同步
容器网络带宽限制的配置建议
使用hostAliases参数配置Pod的/etc/hosts文件
CCE容器中域名解析的最佳实践
CCE中使用x86和ARM双架构镜像
通过Core Dump文件定位容器问题
在CCE Turbo集群中配置Pod延时启动参数
权限
通过配置kubeconfig文件实现集群权限精细化管理
集群命名空间RBAC授权
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
使用Nginx Ingress实现灰度发布和蓝绿发布
批量计算
在CCE集群中部署使用Kubeflow
Kubeflow部署
Tensorflow训练
使用Kubeflow和Volcano实现典型AI训练任务
在CCE集群中部署使用Caffe
预置条件
资源准备
Caffe分类范例
在CCE集群中部署使用Tensorflow
在CCE集群中部署使用Flink
在CCE集群中部署使用ClickHouse
在CCE集群中部署使用Spark
安装Spark
使用Spark on CCE
API参考
使用前必读
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
吊销用户的集群证书
变更集群规格
获取任务信息
绑定、解绑集群公网apiserver地址
获取集群访问的地址
查询集群日志配置信息
配置集群日志
获取分区列表
创建分区
获取分区详情
更新分区
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
节点开启缩容保护
节点关闭缩容保护
同步节点
批量同步节点
纳管节点
自定义节点池纳管节点
重置节点
节点移除
节点迁移
节点迁移到自定义节点池
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
伸缩节点池
同步节点池
存储管理
创建PVC(待废弃)
删除PVC(待废弃)
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
回滚AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
集群升级
集群升级
获取集群升级任务详情
重试集群升级任务
暂停集群升级任务(已废弃)
继续执行集群升级任务(已废弃)
获取集群升级任务详情列表
集群升级前检查
获取集群升级前检查任务详情
获取集群升级前检查任务详情列表
集群升级后确认
集群备份
获取集群备份任务详情列表
获取集群升级相关信息
获取集群升级路径
获取集群升级特性开关配置
开启集群升级流程引导任务
获取UpgradeWorkFlows列表
获取指定集群升级引导任务详情
更新指定集群升级引导任务状态
配额管理
查询CCE服务下的资源配额
API版本信息
查询API版本信息列表
标签管理
批量添加指定集群的资源标签
批量删除指定集群的资源标签
配置管理
查询指定节点池支持配置的参数列表
查询指定集群支持配置的参数列表
查询指定节点池支持配置的参数内容
修改指定节点池配置参数的值
模板管理
上传模板
获取模板列表
获取模板实例列表
更新模板
创建模板实例
删除模板
更新指定模板实例
获取模板
删除指定模板实例
下载模板
获取指定模板实例
获取模板Values
查询指定模板实例历史记录
获取用户模板配额
插件实例字段说明
CoreDNS域名解析
CCE容器存储插件(Everest)
CCE节点故障检测
Kubernetes Dashboard
CCE集群弹性引擎
NGINX Ingress控制器
Kubernetes Metrics Server
CCE容器弹性引擎
CCE突发弹性引擎(对接CCI)
CCE AI套件(NVIDIA GPU)
CCE AI套件(Ascend NPU)
Volcano调度器
CCE密钥管理(对接 DEW)
CCE容器网络扩展指标
节点本地域名解析加速
云原生监控
云原生日志采集
使用Kubernetes API
历史API
获取集群证书
创建PV
删除PV
权限和授权项
附录
状态码
错误码
获取项目ID
获取账号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
默认数据盘空间分配说明
节点磁盘挂载
SDK参考
SDK概述
常见问题
高频常见问题
计费类
云容器引擎CCE如何定价/收费?
CCE集群的计费方式如何由按需改为包年包月?
CCE创建的节点是否支持按需转包周期?
华为云支持哪几种开具发票模式?
CCE是否支持余额不足提醒?
CCE是否支持账户余额变动提醒?
包周期的CCE集群到期可以直接删除吗?
如何退订我的云容器引擎?
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
CCE集群创建时的根证书如何更新?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
CCE集群如何重置或重装?
如何确认已创建的集群是否为多控制节点模式?
是否可以直接连接CCE集群的控制节点?
CCE集群删除之后相关数据能否再次找回?
为什么CCE集群界面的节点磁盘监控看起来不准确?
如何修改CCE集群名称?
集群删除
集群删除失败:安全组中存在残留资源
冻结或不可用的集群删除后如何清除残留资源
集群升级
CCE集群升级时,升级集群插件失败如何排查解决?
节点
节点创建
CCE集群新增节点时的问题与排查方法?
CCE集群纳管节点时的常见问题及排查方法?
纳管节点时失败,报错“安装节点失败”如何解决?
节点运行
集群可用但节点状态为“不可用”如何解决?
CCE集群中的节点无法远程登录,如何排查解决?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
如何解决yum update升级操作系统导致的容器网络不可用问题?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
CCE集群节点中安装kubelet的端口主要有哪些?
如何配置Pod使用GPU节点的加速能力?
容器使用SCSI类型云硬盘偶现IO卡住如何解决?
docker审计日志量过大影响磁盘IO如何解决?
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
CCE节点上监听的端口列表
GPU节点使用nvidia驱动启动容器排查思路
CCE节点NTP时间不同步如何解决?
Containerd节点业务容器标准输出日志写入过快导致节点数据盘使用率过高
为什么kubectl top命令查看节点内存使用超过100%?
CCE节点事件中一直出现“镜像回收失败”告警如何解决?
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点池内的节点变更规格后会有哪些影响?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
CCE集群的节点可以更改IP吗?
操作系统问题说明
低版本内核的CentOS节点反复创删应用时偶现cgroup kmem泄露问题
CCE集群IPVS转发模式下conn_reuse_mode问题说明
cgroup统计资源异常导致kubelet驱逐Pod
低版本内核的CentOS节点出现容器OOM时,偶现ext4文件系统卡死问题
IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时
节点ARP表项超过限制
EulerOS 2.9内核缺陷导致虚拟机卡住
节点池
节点池异常状态排查
节点池一直在扩容中但“操作记录”里为何没有创建节点的记录?
节点池扩容失败
节点池批量扩缩容节点时,Kubernetes Event事件存在部分缺失
云服务器无法纳管至节点池时如何修改云服务器配置
工作负载
工作负载异常问题排查
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:Pod一直处于Terminating状态
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
工作负载异常:添加存储失败
工作负载异常:实例无法写入数据
挂载文件存储的节点,Pod创建删除卡死
容器异常退出状态码
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
CCE启动实例失败时的重试机制是怎样的?
监控日志
工作负载的“事件”保存多长时间?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
如何查看Pod是否使用CPU绑核?
节点关机后Pod不重新调度
如何避免非GPU/NPU负载调度到GPU/NPU节点?
为什么Pod调度不到某个节点上?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
CCE集群中工作负载镜像的拉取策略有哪些?
鲲鹏集群Docker容器挂载点被卸载
下载镜像缺少层如何解决?
容器内的文件权限和用户都是问号
网络管理
网络异常问题排查
工作负载网络异常时,如何定位排查?
集群内部无法使用ELB地址访问负载
集群外部访问Ingress异常
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
VPC的子网无法删除,怎么办?
如何修复出现故障的容器网卡?
节点无法连接互联网(公网),如何排查定位?
如何解决VPC网段与容器网络冲突的问题?
ELB四层健康检查导致java报错:Connection reset by peer
Service事件:Have no node to bind,如何排查?
为什么登录虚拟机VNC界面会间歇性出现Dead loop on virtual device gw_11cbf51a, fix it urgently?
集群节点使用networkpolicy概率性出现panic问题
节点远程登录界面(VNC)打印较多source ip_type日志问题
使用IE浏览器访问nginx-ingress出现重定向308无法访问
NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常
负载均衡型Service更新出现错误:Quota exceeded for resources: members_per_pool
为ELB Ingress配置了HTTPS证书后访问异常的原因有哪些?
网络规划
集群与虚拟私有云、子网的关系是怎样的?
如何查看虚拟私有云VPC的网段?
如何设置CCE集群中的VPC网段和子网网段?
如何设置CCE集群中的容器网段?
什么是云原生网络2.0网络模式,适用于什么场景?
什么是弹性网卡?
集群安全组规则配置
创建CCE Turbo集群时如何设置IPv6服务网段
CCE集群的节点是否支持绑定多网卡?
安全加固
集群节点如何不暴露到公网?
如何配置集群的访问策略
如何获取TLS密钥证书?
如何批量修改集群node节点安全组?
网络指导
CCE如何与其他服务进行内网通信?
使用CCE设置工作负载访问方式时,端口如何填写?
Ingress中的property字段如何实现与社区client-go兼容?
服务加入Istio后,如何获取客户端真实源IP?
为什么更换命名空间后无法创建Ingress?
服务发布到ELB,ELB的后端为何会被自动删除?
如何使容器重启后所在容器IP仍保持不变?
如何确认网卡不被集群占用?
删除子网后如何删除安全组规则?
不同命名空间下的Ingress共用监听器时如何同步生效的证书?
如何确认监听器配置生效的Ingress
存储管理
如何扩容容器的存储空间?
CCE支持的存储在持久化和多节点挂载方面的有什么区别?
创建CCE节点时可以不添加数据盘吗?
CCE集群中的EVS存储卷被删除或者过期后是否可以恢复?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
创建存储卷失败如何解决?
CCE容器云存储PVC能否感知底层存储故障?
通用文件存储(SFS 3.0)在OS中的挂载点修改属组及权限报错
无法使用kubectl命令删除PV或PVC
删除挂载了云存储的Pod时提示target is busy
无法自动创建包周期的云硬盘存储卷
命名空间
命名空间因APIService对象访问失败无法删除
如何删除Terminating状态的命名空间?
模板插件
集群安装nginx-ingress插件失败,一直处于创建中?
NPD插件版本过低导致进程资源残留问题
模板格式不正确,无法删除模板实例?
CCE是否支持nginx-ingress?
插件安装失败,提示The release name is already exist如何解决?
创建或升级实例失败,提示rendered manifests contain a resource that already exists
kube-prometheus-stack插件实例调度失败如何解决?
上传模板失败如何解决?
如何根据集群规格调整插件配额?
NGINX Ingress控制器插件处于Unknown状态时卸载残留
NGINX Ingress控制器插件升级后无法使用TLS v1.0和v1.1
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
CCE集群内域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
为什么修改子网DNS配置后,无法解析租户区域名?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
镜像仓库
如何制作Docker镜像?如何解决拉取镜像慢的问题?
如何上传我的镜像到CCE中使用?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
相关服务
云容器引擎(CCE)与云容器实例(CCI)的区别是什么?
云容器引擎(CCE)和应用管理与运维平台(ServiceStage)的区别是什么?
视频帮助
更多文档
用户指南(阿布扎比区域)
产品介绍
什么是云容器引擎
产品优势
应用场景
基础设施与容器应用管理
秒级弹性伸缩
DevOps持续交付
混合云架构
约束与限制
权限管理
基本概念
基本概念
CCE与原生Kubernetes名词对照
区域与可用区
与其它云服务的关系
快速入门
入门指引
准备工作
快速创建Kubernetes集群
创建无状态工作负载(Nginx)
部署有依赖关系的WordPress和MySQL
概述
步骤1:创建MySQL
步骤2:创建WordPress
高危操作及解决方案
集群
集群概述
集群基本信息
Kubernetes版本发布说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
Kubernetes 1.21版本说明
Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
CCE集群版本发布说明
购买集群
CCE Turbo集群与CCE Standard集群的区别
购买集群
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过X509证书连接集群
通过自定义域名访问集群
升级集群
升级概述
升级前须知
原地升级
升级后验证
存量Pod检查
存量节点与容器网络检查
存量节点标签与污点检查
跳过节点检查
业务检查
新建节点检查
新建Pod检查
集群跨版本业务迁移
升级前检查异常问题排查
升级前检查项
节点限制检查
升级管控检查
插件检查
Helm模板检查
Master节点SSH联通性检查
节点池检查
安全组检查
ARM节点限制检查
残留待迁移节点检查
K8s废弃资源检查
兼容性风险检查
节点CCE Agent版本检查
节点CPU使用率检查
CRD检查
节点磁盘检查
节点DNS检查
节点关键目录文件权限检查
节点Kubelet检查
节点内存检查
节点时钟同步服务器检查
节点OS检查
节点CPU数量检查
节点Python命令检查
ASM网格版本检查
节点Ready检查
节点journald检查
节点干扰ContainerdSock检查
内部错误
节点挂载点检查
K8s节点污点检查
everest插件版本限制检查
cce-hpa-controller插件限制检查
增强型CPU管理策略检查
用户节点组件健康检查
控制节点组件健康检查
K8s组件内存资源限制检查
K8s废弃API检查
CCE Turbo集群IPv6能力检查
节点NetworkManager检查
节点ID文件检查
节点配置一致性检查
节点配置文件检查
CoreDNS配置一致性检查
节点Sudo检查
节点关键命令检查
节点sock文件挂载检查
HTTPS类型负载均衡证书一致性检查
节点挂载检查
节点paas用户登录权限检查
ELB IPv4私网地址检查
检查历史升级记录是否满足升级条件
检查集群管理平面网段是否与主干配置一致
GPU插件检查
节点系统参数检查
残留packageversion检查
节点命令行检查
节点交换区检查
nginx-ingress插件升级检查
管理集群
集群配置管理
集群过载控制
变更集群规格
更改集群节点的默认安全组
删除集群
休眠与唤醒集群
节点
节点概述
容器引擎
创建节点
纳管节点
登录节点
管理节点
管理节点标签
管理节点污点(Taint)
重置节点
移除节点
同步云服务器
节点排水
删除节点
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
数据盘空间分配说明
节点可创建的最大Pod数量说明
将节点容器引擎从Docker迁移到Containerd
节点故障检测策略
节点池
节点池概述
创建节点池
管理节点池
更新节点池
更新弹性伸缩配置
节点池配置管理
拷贝节点池
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
容器设置
时区同步
配置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
性能管理配置(性能瓶颈分析)
工作负载升级策略
调度策略(亲和与反亲和)
容忍策略
标签与注解
登录容器
管理工作负载和任务
安全运行时与普通运行时
调度
调度概述
CPU调度
CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
NPU调度
Volcano调度
Volcano调度概述
使用Volcano调度工作负载
资源利用率优化调度
装箱调度(Binpack)
重调度(Descheduler)
节点池亲和性调度
AI任务性能增强调度
公平调度(DRF)
组调度(Gang)
NUMA亲和性调度
网络
网络概述
容器网络模型
容器网络模型对比
容器隧道网络
VPC网络
云原生网络2.0
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡
Service使用HTTP/HTTPS协议
指定多个端口配置健康检查
通过ELB健康检查设置Pod就绪状态
负载均衡类型的服务设置超时时间
LoadBalancer类型Service使用pass-through能力
健康检查使用UDP协议的安全组规则说明
DNAT网关(DNAT)
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
使用Annotation配置ELB Ingress
ELB Ingress配置HTTPS证书
ELB Ingress配置服务器名称指示(SNI)
ELB Ingress路由到多个服务
ELB Ingress使用HTTP/2
ELB Ingress对接HTTPS协议的后端服务
ELB Ingress设置超时时间
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
使用Annotation配置Nginx Ingress
Nginx Ingress配置HTTPS证书
Nginx Ingress配置URL重写规则
Nginx Ingress对接HTTPS协议的后端服务
Nginx Ingress使用一致性哈希负载均衡
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
使用NodeLocal DNSCache提升DNS性能
容器网络配置
主机网络(hostNetwork)
为Pod配置QoS
容器隧道网络配置
网络策略(NetworkPolicy)
云原生网络2.0配置
安全组策略(SecurityGroup)
容器网络配置(NetworkAttachmentDefinition)
集群网络配置
切换节点子网
扩展集群容器网段
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
有状态负载动态挂载云硬盘存储
快照与备份
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
SFS Turbo动态创建子目录并挂载
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
有状态负载动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
日志中心
日志中心概述
收集数据面日志
容器日志对接AOM
可观测性最佳实践
使用Prometheus监控自定义指标
使用AOM监控自定义指标
云审计服务
云审计服务支持的CCE操作列表
查询审计事件
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
HPA策略
CronHPA定时策略
CustomedHPA策略
管理工作负载伸缩策略
节点弹性伸缩
节点伸缩原理
创建节点伸缩策略
管理节点伸缩策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
插件
插件概述
CoreDNS域名解析
CCE容器存储(Everest)
CCE节点故障检测
Kubernetes Dashboard
CCE集群弹性引擎
NGINX Ingress控制器
Kubernetes Metrics Server
CCE容器弹性引擎
CCE AI套件(NVIDIA GPU)
CCE AI套件(Ascend NPU)
Volcano调度器
CCE密钥管理(对接 DEW)
CCE容器网络扩展指标
节点本地域名解析加速
Prometheus
模板(Helm Chart)
概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
ServiceAccount Token安全性提升说明
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
方案概述
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
容灾
在CCE中实现应用高可用部署
安全
集群安全配置
节点安全配置
容器安全配置
密钥Secret安全配置
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
监控
Prometheus监控多个集群
集群
制作CCE节点自定义镜像
创建节点时执行安装后脚本
通过kubectl对接多个集群
选择合适的节点数据盘大小
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
通过模板包部署Nginx Ingress Controller
部署多个Nginx Ingress Controller
Nginx Ingress Controller高级配置
CCE Turbo配置容器网卡动态预热
存储
存储扩容
挂载第三方租户的对象存储
SFS Turbo动态创建子目录并挂载
自定义StorageClass
节点跨AZ时云硬盘自动拓扑(csi-disk-topology)
容器
合理分配容器计算资源
通过特权容器功能优化内核参数
使用Init容器初始化应用
使用hostAliases配置Pod /etc/hosts
容器Core Dump
权限
通过配置kubeconfig文件实现集群权限精细化管理
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
使用Nginx Ingress实现灰度发布和蓝绿发布
常见问题
高频常见问题
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
集群删除之后相关数据能否再次找回?
集群删除
集群删除失败:弹性网卡残留
冻结或不可用的集群删除后如何清除残留资源
集群升级
CCE集群升级时,升级集群插件失败如何排查解决?
节点
节点创建
CCE集群新增节点时的问题与排查方法?
节点运行
集群可用,但节点状态为“不可用”?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
容器使用SCSI类型云硬盘偶现IO卡住
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
GPU节点使用nvidia驱动启动容器排查思路
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
节点池
节点池一直在扩容中,但“操作记录”里却没有创建节点的记录?
工作负载
工作负载异常
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
Dockerfile中ENTRYPOINT指定JVM启动堆内存参数后部署容器启动报错?
CCE启动实例失败时的重试机制是怎样的?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
为什么Pod调度不到某个节点上?
CCE集群中工作负载镜像的拉取策略?
下载镜像缺少层如何解决
网络管理
网络规划
集群与虚拟私有云、子网的关系是怎样的?
集群安全组规则配置
网络异常
工作负载网络异常时,如何定位排查?
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
节点无法连接互联网(公网),如何排查定位?
其他
如何批量修改集群node节点安全组?
存储管理
CCE支持的存储在持久化和多节点挂载方面的区别是怎样的?
添加节点时可以不要数据盘吗?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
CCE容器云存储PVC能否感知底层存储故障?
命名空间
命名空间因APIService对象访问失败无法删除
模板插件
插件安装失败,提示The release name is already exist处理
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
镜像仓库
如何上传我的镜像到CCE中使用?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
参考知识
如何扩容容器的存储空间?
如何使容器重启后所在容器IP仍保持不变?
API参考(阿布扎比区域)
使用前必读
概述
调用说明
终端节点(Endpoint)
约束与限制
基本概念
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
获取任务信息
绑定、解绑集群公网apiserver地址
获取集群访问的地址
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
纳管节点
重置节点
节点移除
节点迁移
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
存储管理
创建PVC(待废弃)
删除PVC(待废弃)
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
配额管理
查询CCE服务下的资源配额
API版本信息
查询API版本信息列表
使用Kubernetes API
权限和授权项
附录
状态码
错误码
获取项目ID
获取帐号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
数据盘空间分配说明
节点磁盘挂载
修订记录
用户指南(巴黎区域)
产品介绍
什么是云容器引擎
产品优势
应用场景
基础设施与容器应用管理
秒级弹性伸缩
DevOps持续交付
混合云架构
约束与限制
权限管理
计费说明
基本概念
基本概念
CCE与原生Kubernetes名词对照
CCE Turbo集群
区域与可用区
与其它云服务的关系
产品公告
集群节点高危操作
CCE安全使用指引
集群节点操作系统补丁说明
漏洞公告
Kubernetes安全漏洞公告(CVE-2022-3172)
Linux Kernel openvswitch 模块权限提升漏洞预警(CVE-2022-2639)
CRI-O容器运行时引擎任意代码执行漏洞(CVE-2022-0811)
linux内核导致的容器逃逸漏洞公告(CVE-2022-0492)
Linux内核整数溢出漏洞(CVE-2022-0185)
Kubernetes基础知识
概述
容器与Kubernetes
容器
Kubernetes
Pod、Label和Namespace
Pod:Kubernetes中的最小调度对象
存活探针(Liveness Probe)
Label:组织Pod的利器
Namespace:资源分组
Pod的编排与调度
Deployment
StatefulSet
Job和CronJob
DaemonSet
亲和与反亲和调度
配置管理
ConfigMap
Secret
Kubernetes网络
容器网络
Service
Ingress
就绪探针(Readiness Probe)
NetworkPolicy
持久化存储
Volume
PV、PVC和StorageClass
认证与授权
ServiceAccount
RBAC
弹性伸缩
快速入门
入门指引
准备工作
快速创建Kubernetes集群
镜像创建无状态工作负载(Nginx)
部署有依赖关系的WordPress和MySQL
概述
步骤1:创建MySQL
步骤2:创建WordPress
高危操作及解决方案
集群
集群概述
集群基本信息
Kubernetes版本发布说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
Kubernetes 1.21版本说明
Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
CCE集群版本发布说明
创建集群
CCE Turbo集群与CCE集群的区别
创建集群
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过X509证书连接集群
通过自定义域名访问集群
升级集群
升级概述
升级前须知
原地升级
升级后验证
业务验证
存量Pod检查
存量节点与容器网络检查
存量节点标签与污点检查
新建节点检查
新建Pod检查
跳过节点检查
集群跨版本业务迁移
升级前检查异常问题排查
升级前检查项
节点限制检查
升级管控检查
插件检查
Helm模板检查
Master节点SSH联通性检查
节点池检查
安全组检查
ARM节点限制检查
残留待迁移节点检查
K8s废弃资源检查
兼容性风险检查
节点CCE Agent版本检查
节点CPU使用率检查
CRD检查
节点磁盘检查
节点DNS检查
节点关键目录文件权限检查
节点Kubelet检查
节点内存检查
节点时钟同步服务器检查
节点OS检查
节点CPU数量检查
节点Python命令检查
ASM网格版本检查
节点Ready检查
节点journald检查
节点干扰ContainerdSock检查
内部错误
节点挂载点检查
K8s节点污点检查
everest插件版本限制检查
cce-hpa-controller插件限制检查
增强型CPU管理策略检查
用户节点组件健康检查
控制节点组件健康检查
K8s组件内存资源限制检查
K8s废弃API检查
CCE Turbo集群IPv6能力检查
节点NetworkManager检查
节点ID文件检查
节点配置一致性检查
节点配置文件检查
CoreDNS配置一致性检查
节点Sudo检查
节点关键命令检查
节点sock文件挂载检查
HTTPS类型负载均衡证书一致性检查
节点挂载检查
节点paas用户登录权限检查
ELB IPv4私网地址检查
检查历史升级记录是否满足升级条件
检查集群管理平面网段是否与主干配置一致
GPU插件检查
节点系统参数检查
残留packageversion检查
节点命令行检查
节点交换区检查
nginx-ingress插件升级检查
管理集群
集群配置管理
集群过载控制
变更集群规格
删除集群
休眠与唤醒集群
节点
节点概述
容器引擎
创建节点
纳管节点
登录节点
管理节点
管理节点标签
管理节点污点(Taint)
重置节点
移除节点
同步云服务器
删除节点
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
数据盘空间分配说明
节点可创建的最大Pod数量说明
将节点容器引擎从Docker迁移到Containerd
节点故障检测策略
节点池
节点池概述
创建节点池
管理节点池
更新节点池
节点池配置管理
拷贝节点池
同步节点池
升级操作系统
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
容器设置
时区同步
配置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
工作负载升级策略
调度策略(亲和与反亲和)
容忍策略
标签与注解
登录容器
管理工作负载和任务
调度
调度概述
CPU调度
CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
volcano调度
NUMA亲和性调度
网络
网络概述
容器网络模型
容器网络模型对比
容器隧道网络
VPC网络
云原生网络2.0
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡
Service使用HTTP协议
指定多个端口配置健康检查
负载均衡类型的服务设置超时时间
LoadBalancer类型Service使用pass-through能力
健康检查使用UDP协议的安全组规则说明
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
使用Annotation配置ELB Ingress
ELB Ingress配置HTTPS证书
ELB Ingress配置服务器名称指示(SNI)
ELB Ingress路由到多个服务
ELB Ingress使用HTTP/2
ELB Ingress对接HTTPS协议的后端服务
ELB Ingress设置超时时间
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
Nginx Ingress配置HTTPS证书
Nginx Ingress配置URL重写规则
Nginx Ingress对接HTTPS协议的后端服务
Nginx Ingress使用一致性哈希负载均衡
使用Annotation配置Nginx Ingress
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
容器网络配置
主机网络(hostNetwork)
Pod互访QoS限速
容器隧道网络配置
网络策略(NetworkPolicy)
云原生网络2.0配置
安全组策略(SecurityGroup)
网络配置(NetworkAttachmentDefinition)
集群网络配置
切换节点子网
扩展集群容器网段
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
有状态负载动态挂载云硬盘存储
快照与备份
文件存储(SFS)
文件存储概述
通过静态存储卷使用已有文件存储
通过动态存储卷使用文件存储
设置文件存储挂载参数
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
SFS Turbo动态创建子目录并挂载
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
有状态负载动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
日志管理
日志概述
使用ICAgent采集容器日志
监控管理
监控概述
使用AOM监控自定义指标
云审计日志
云审计服务支持的CCE操作列表
查询审计事件
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
HPA策略
管理工作负载伸缩策略
节点弹性伸缩
节点伸缩原理
创建节点伸缩策略
管理节点伸缩策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
插件
插件概述
CoreDNS
CCE Container Storage (Everest)
npd
CCE Cluster Autoscaler
NGNIX Ingress Controller
Kubernetes Metrics Server
gpu-device-plugin
Volcano Scheduler
CCE Container Storage (FlexVolume)
模板(Helm Chart)
概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
ServiceAccount Token安全性提升说明
常见问题
高频常见问题
计费类
云容器引擎CCE如何定价/收费?
CCE是否支持余额不足提醒?
CCE是否支持账户余额变动提醒?
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
集群删除之后相关数据能否再次找回?
集群删除
集群删除失败:弹性网卡残留
冻结或不可用的集群删除后如何清除残留资源
集群升级
CCE集群升级时,升级集群插件失败如何排查解决?
节点
节点创建
CCE集群新增节点时的问题与排查方法?
节点运行
集群可用,但节点状态为“不可用”?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
容器使用SCSI类型云硬盘偶现IO卡住
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
GPU节点使用nvidia驱动启动容器排查思路
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
节点池
节点池一直在扩容中,但“操作记录”里却没有创建节点的记录?
工作负载
工作负载异常
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
实例网络空间更新,报sandbox相关错,如何处理?
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
Dockerfile中ENTRYPOINT指定JVM启动堆内存参数后部署容器启动报错?
CCE启动实例失败时的重试机制是怎样的?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
为什么Pod调度不到某个节点上?
CCE集群中工作负载镜像的拉取策略?
下载镜像缺少层如何解决
网络管理
网络规划
集群与虚拟私有云、子网的关系是怎样的?
集群安全组规则配置
网络异常
工作负载网络异常时,如何定位排查?
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
节点无法连接互联网(公网),如何排查定位?
NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常
存储管理
CCE支持的存储在持久化和多节点挂载方面的区别是怎样的?
添加节点时可以不要数据盘吗?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
CCE容器云存储PVC能否感知底层存储故障?
命名空间
命名空间因APIService对象访问失败无法删除
模板插件
插件安装失败,提示The release name is already exist处理
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
镜像仓库
如何上传我的镜像到CCE中使用?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
参考知识
如何扩容容器的存储空间?
如何使容器重启后所在容器IP仍保持不变?
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
方案概述
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
容灾
在CCE中实现应用高可用部署
安全
集群安全配置
节点安全配置
容器安全配置
密钥Secret安全配置
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
监控
Prometheus监控多个集群
集群
通过kubectl对接多个集群
选择合适的节点数据盘大小
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
存储
存储扩容
挂载第三方租户的对象存储
SFS Turbo动态创建子目录并挂载
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型
自定义StorageClass
节点跨AZ时云硬盘自动拓扑(csi-disk-topology)
容器
合理分配容器计算资源
通过特权容器功能优化内核参数
使用Init容器初始化应用
使用hostAliases配置Pod /etc/hosts
容器Core Dump
权限
通过配置kubeconfig文件实现集群权限精细化管理
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
将老版本的数据迁移到最新版本
版本间差异
镜像迁移
迁移集群
迁移应用
通过API或kubectl创建的应用
通过组件模板创建的应用
通过设计器创建的应用
API参考 (巴黎区域)
使用前必读
概述
调用说明
终端节点(Endpoint)
约束与限制
基本概念
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
获取任务信息
绑定、解绑集群公网apiserver地址
获取集群访问的地址
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
纳管节点
重置节点
节点移除
节点迁移
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
配额管理
查询CCE服务下的资源配额
API版本信息
查询API版本信息列表
使用Kubernetes API
权限和授权项
附录
状态码
错误码
获取项目ID
获取帐号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
数据盘空间分配说明
节点磁盘挂载
修订记录
用户指南(吉隆坡区域)
产品介绍
什么是云容器引擎
产品优势
应用场景
容器应用管理
秒级弹性伸缩
DevOps持续交付
混合云
约束与限制
权限管理
与其它云服务的关系
区域与可用区
控制台风格升级说明
快速入门
入门指引
准备工作
快速创建Kubernetes集群
部署无状态工作负载(Nginx)
部署有依赖关系的WordPress和MySQL
概述
步骤1:部署MySQL
步骤2:部署WordPress
高危操作一览
集群
集群概述
集群基本信息
Kubernetes版本发布记录
Kubernetes 1.29版本说明
Kubernetes 1.28版本说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
(停止维护)Kubernetes 1.21版本说明
(停止维护)Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
补丁版本发布记录
购买集群
购买Standard集群
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过X509证书连接集群
通过自定义域名访问集群
配置集群API Server公网访问
管理集群
修改CCE集群配置
开启集群过载控制
变更集群规格
更改集群节点的默认安全组
删除集群
休眠/唤醒集群
升级集群
升级集群的流程和方法
升级前须知
升级后验证
集群状态检查
节点状态检查
跳过节点检查
业务检查
新建节点检查
新建Pod检查
集群跨版本业务迁移
升级前检查异常问题排查
升级前检查项
节点限制检查异常处理
升级管控检查异常处理
插件检查异常处理
Helm模板检查异常处理
Master节点SSH联通性检查异常处理
节点池检查异常处理
安全组检查异常处理
ARM节点限制检查异常处理
残留待迁移节点检查异常处理
K8s废弃资源检查异常处理
兼容性风险检查异常处理
节点CCE Agent版本检查异常处理
节点CPU使用率检查异常处理
CRD检查异常处理
节点磁盘检查异常处理
节点DNS检查异常处理
节点关键目录文件权限检查异常处理
节点Kubelet检查异常处理
节点内存检查异常处理
节点时钟同步服务器检查异常处理
节点OS检查异常处理
节点CPU数量检查异常处理
节点Python命令检查异常处理
ASM网格版本检查异常处理
节点Ready检查异常处理
节点journald检查异常处理
节点干扰ContainerdSock检查异常处理
内部错误异常处理
节点挂载点检查异常处理
K8s节点污点检查异常处理
everest插件版本限制检查异常处理
cce-hpa-controller插件限制检查异常处理
增强型CPU管理策略检查异常处理
用户节点组件健康检查异常处理
控制节点组件健康检查异常处理
K8s组件内存资源限制检查异常处理
K8s废弃API检查异常处理
节点NetworkManager检查异常处理
节点ID文件检查异常处理
节点配置一致性检查异常处理
节点配置文件检查异常处理
CoreDNS配置一致性检查异常处理
节点Sudo检查异常处理
节点关键命令检查异常处理
节点sock文件挂载检查异常处理
HTTPS类型负载均衡证书一致性检查异常处理
节点挂载检查异常处理
节点paas用户登录权限检查异常处理
ELB IPv4私网地址检查异常处理
检查历史升级记录是否满足升级条件
检查集群管理平面网段是否与主干配置一致
GPU插件检查异常处理
节点系统参数检查异常处理
残留packageversion检查异常处理
节点命令行检查异常处理
节点交换区检查异常处理
nginx-ingress插件升级检查异常处理
云原生监控插件升级检查异常处理
Containerd Pod重启风险检查异常处理
GPU插件关键参数检查异常处理
GPU/NPU Pod重建风险检查异常处理
ELB监听器访问控制配置项检查异常处理
Master节点规格检查异常处理
Master节点子网配额检查异常处理
节点运行时检查异常处理
节点池运行时检查异常处理
检查节点镜像数量异常处理
节点
节点概述
容器引擎说明
创建节点
纳管节点
登录节点
管理节点
管理节点标签
管理节点污点
重置节点
移除节点
同步云服务器
节点排水
删除节点
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
数据盘空间分配说明
节点可创建的最大Pod数量说明
将节点容器引擎从Docker迁移到Containerd
配置节点故障检测策略
节点池
节点池概述
创建节点池
扩缩容节点池
管理节点池
更新节点池
更新弹性伸缩配置
修改节点池配置
纳管节点至节点池
复制节点池
同步节点池
升级操作系统
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
配置工作负载
设置时区同步
设置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
设置工作负载升级策略
调度策略(亲和与反亲和)
设置容忍策略
设置标签与注解
登录容器实例
管理工作负载
管理自定义资源
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
调度
调度概述
CPU调度
CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
NPU调度
Volcano调度
Volcano调度概述
使用Volcano调度工作负载
资源利用率优化调度
装箱调度(Binpack)
重调度(Descheduler)
节点池亲和性调度
负载感知调度
资源利用率优化调度配置案例
业务优先级保障调度
优先级调度
AI任务性能增强调度
公平调度(DRF)
组调度(Gang)
NUMA亲和性调度
网络
网络概述
容器网络
容器网络模型对比
VPC网络模型
VPC网络模型说明
扩展集群容器网段
容器隧道网络模型
容器隧道网络模型说明
配置网络策略限制Pod访问的对象
Pod网络配置
在Pod中配置主机网络(hostNetwork)
为Pod配置QoS
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡
为负载均衡类型的Service配置HTTP/HTTPS协议
为负载均衡类型的Service配置服务器名称指示(SNI)
为负载均衡类型的Service配置HTTP/2
为负载均衡类型的Service配置超时时间
为负载均衡类型的Service指定多个端口配置健康检查
为负载均衡类型的Service配置pass-through能力
健康检查使用UDP协议的安全组规则说明
DNAT网关(DNAT)
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
使用Annotation配置ELB Ingress
为ELB Ingress配置HTTPS证书
为ELB Ingress配置服务器名称指示(SNI)
为ELB Ingress路由到多个服务
为ELB Ingress配置HTTP/2
为ELB Ingress配置HTTPS协议的后端服务
为ELB Ingress配置超时时间
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
使用Annotation配置Nginx Ingress
为Nginx Ingress配置HTTPS证书
为Nginx Ingress配置HTTPS协议的后端服务
为Nginx Ingress配置一致性哈希负载均衡
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
使用NodeLocal DNSCache提升DNS性能
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
在有状态负载中动态挂载云硬盘存储
加密云硬盘存储卷
扩容云硬盘存储卷
快照与备份
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
通过动态存储卷创建SFS Turbo子目录(推荐)
通过StorageClass动态创建SFS Turbo子目录
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
专属存储(DSS)
专属存储概述
通过静态存储卷使用专属存储
通过动态存储卷使用专属存储
在有状态负载中动态挂载专属存储
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
在有状态负载中动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
日志中心
日志中心概述
收集容器日志
通过ICAgent采集容器日志
日志审计
云审计服务支持的CCE操作列表
在CTS事件列表查看云审计事件
可观测性最佳实践
使用云原生监控插件监控自定义指标
使用AOM监控自定义指标
使用Prometheus监控Master节点组件指标
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
创建HPA策略
创建CronHPA定时策略
创建CustomedHPA策略
管理工作负载弹性伸缩策略
节点弹性伸缩
节点伸缩原理
节点池弹性伸缩优先级说明
创建节点弹性策略
管理节点弹性策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
插件
插件概述
容器调度与弹性插件
Volcano调度器
CCE集群弹性引擎
CCE容器弹性引擎
云原生可观测性插件
云原生监控插件
云原生日志采集插件
CCE节点故障检测
CCE容器网络扩展指标
Kubernetes Metrics Server
Grafana
Prometheus
云原生异构计算插件
CCE AI套件(NVIDIA GPU)
CCE AI套件(Ascend NPU)
容器网络插件
CoreDNS域名解析
NGINX Ingress控制器
节点本地域名解析加速
容器存储插件
CCE容器存储(Everest)
容器安全插件
CCE密钥管理(对接 DEW)
其他插件
Kubernetes Dashboard
Kubernetes Web终端(停止维护)
模板(Helm Chart)
概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
ServiceAccount Token安全性提升说明
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
应用容器化改造方案概述
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
容灾
CCE集群高可用推荐配置
在CCE中实现应用高可用部署
插件高可用部署
安全
CCE集群安全配置建议
CCE节点安全配置建议
在CCE集群中使用容器的安全配置建议
在CCE集群中使用密钥Secret的安全配置建议
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
监控
使用Prometheus监控多个集群
集群
CCE集群选型建议
通过CCE搭建IPv4/IPv6双栈集群
创建节点时执行安装前/后脚本
通过kubectl对接多个集群
选择合适的节点数据盘大小
集群过载保护最佳实践
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
CoreDNS配置优化实践
概述
客户端
优化域名解析请求
选择合适的镜像
避免IPVS缺陷导致的DNS概率性解析超时
使用节点DNS缓存NodeLocal DNSCache
及时升级集群中的CoreDNS版本
谨慎调整VPC和虚拟机的DNS配置
服务端
监控CoreDNS运行状态
调整CoreDNS部署状态
合理配置CoreDNS
保留Pod IP非伪装网段最佳实践
存储
存储扩容
挂载第三方租户的对象存储
通过StorageClass动态创建SFS Turbo子目录
自定义StorageClass
使用延迟绑定的云硬盘(csi-disk-topology)实现跨AZ调度
容器
合理分配容器计算资源
通过特权容器功能优化内核参数
使用Init容器初始化应用
使用hostAliases参数配置Pod的/etc/hosts文件
通过Core Dump文件定位容器问题
权限
通过配置kubeconfig文件实现集群权限精细化管理
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
使用Nginx Ingress实现灰度发布和蓝绿发布
常见问题
高频常见问题
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
CCE集群删除之后相关数据能否再次找回?
集群删除
集群删除失败:安全组中存在残留资源
冻结或不可用的集群删除后如何清除残留资源
集群升级
CCE集群升级时,升级集群插件失败如何排查解决?
节点
节点创建
CCE集群新增节点时的问题与排查方法?
CCE集群纳管节点时的常见问题及排查方法?
纳管节点时失败,报错“安装节点失败”如何解决?
节点运行
集群可用但节点状态为“不可用”如何解决?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
容器使用SCSI类型云硬盘偶现IO卡住如何解决?
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
GPU节点使用nvidia驱动启动容器排查思路
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点池内的节点变更规格后会有哪些影响?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
操作系统问题说明
CCE集群IPVS转发模式下conn_reuse_mode问题说明
节点池
节点池异常状态排查
节点池一直在扩容中但“操作记录”里为何没有创建节点的记录?
节点池扩容失败
云服务器无法纳管至节点池时如何修改云服务器配置
工作负载
工作负载异常
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
CCE启动实例失败时的重试机制是怎样的?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
为什么Pod调度不到某个节点上?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
CCE集群中工作负载镜像的拉取策略有哪些?
下载镜像缺少层如何解决?
网络管理
网络规划
集群与虚拟私有云、子网的关系是怎样的?
集群安全组规则配置
网络异常
工作负载网络异常时,如何定位排查?
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
节点无法连接互联网(公网),如何排查定位?
NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常
安全加固
集群节点如何不暴露到公网?
如何配置集群的访问策略
如何批量修改集群node节点安全组?
网络指导
如何使容器重启后所在容器IP仍保持不变?
存储管理
如何扩容容器的存储空间?
CCE支持的存储在持久化和多节点挂载方面的有什么区别?
创建CCE节点时可以不添加数据盘吗?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
CCE容器云存储PVC能否感知底层存储故障?
命名空间
命名空间因APIService对象访问失败无法删除
模板插件
插件安装失败,提示The release name is already exist如何解决?
如何根据集群规格调整插件配额?
NGINX Ingress控制器插件处于Unknown状态时卸载残留
NGINX Ingress控制器插件升级后无法使用TLS v1.0和v1.1
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
CCE集群内域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
镜像仓库
如何上传我的镜像到CCE中使用?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
API参考(吉隆坡区域)
使用前必读
概述
调用说明
终端节点(Endpoint)
约束与限制
基本概念
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
变更集群规格
获取任务信息
绑定、解绑集群公网apiserver地址
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
纳管节点
重置节点
节点移除
节点迁移
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
存储管理
创建PVC(待废弃)
删除PVC(待废弃)
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
回滚AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
标签管理
批量添加指定集群的资源标签
批量删除指定集群的资源标签
配置管理
查询指定节点池支持配置的参数列表
查询指定集群支持配置的参数列表
查询指定节点池支持配置的参数内容
修改指定节点池配置参数的值
模板管理
上传模板
获取模板列表
获取模板实例列表
更新模板
创建模板实例
删除模板
更新指定模板实例
获取模板
删除指定模板实例
下载模板
获取指定模板实例
获取模板Values
查询指定模板实例历史记录
获取用户模板配额
使用Kubernetes API
权限和授权项
附录
状态码
错误码
获取项目ID
获取账号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
数据盘空间分配说明
节点磁盘挂载
用户指南(安卡拉区域)
产品介绍
什么是云容器引擎
产品优势
应用场景
容器应用管理
秒级弹性伸缩
DevOps持续交付
混合云
约束与限制
权限管理
与其它云服务的关系
区域与可用区
产品公告
Kubernetes版本策略
快速入门
入门指引
准备工作
快速创建Kubernetes集群
创建无状态工作负载(Nginx)
部署有依赖关系的WordPress和MySQL
概述
步骤1:创建MySQL
步骤2:创建WordPress
高危操作及解决方案
集群
集群概述
集群基本信息
Kubernetes版本发布记录
Kubernetes 1.28版本说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
Kubernetes 1.21版本说明
(停止维护)Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
补丁版本发布记录
创建集群
创建Standard集群
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过X509证书连接集群
通过自定义域名访问集群
管理集群
集群配置管理
集群过载控制
变更集群规格
更改集群节点的默认安全组
删除集群
休眠与唤醒集群
节点
节点概述
容器引擎
创建节点
纳管节点
管理节点
管理节点标签
管理节点污点(Taint)
重置节点
移除节点
同步云服务器
节点排水
删除节点
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
数据盘空间分配说明
节点可创建的最大Pod数量说明
将节点容器引擎从Docker迁移到Containerd
节点故障检测策略
节点池
节点池概述
创建节点池
管理节点池
更新节点池
更新弹性伸缩配置
节点池配置管理
复制节点池
同步节点池
升级操作系统
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
容器设置
时区同步
配置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
工作负载升级策略
调度策略(亲和与反亲和)
容忍策略
标签与注解
登录容器
管理工作负载和任务
管理自定义资源
调度
调度概述
CPU调度
CPU管理策略
增强型CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
GPU虚拟化
GPU虚拟化概述
准备GPU虚拟化资源
使用GPU虚拟化
兼容Kubernetes默认GPU调度模式
监控GPU资源指标
基于GPU监控指标的弹性伸缩实践
GPU故障处理
NPU调度
Volcano调度
Volcano调度概述
使用Volcano调度工作负载
资源利用率优化调度
装箱调度(Binpack)
重调度(Descheduler)
节点池亲和性调度
负载感知调度
资源利用率优化调度配置案例
业务优先级保障调度
优先级调度
AI任务性能增强调度
公平调度(DRF)
组调度(Gang)
NUMA亲和性调度
云原生混部
动态资源超卖
网络
网络概述
容器网络模型
容器网络模型对比
容器隧道网络
VPC网络
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡
Service配置HTTP/HTTPS协议
Service配置服务器名称指示(SNI)
Service配置超时时间
Service指定多个端口配置健康检查
LoadBalancer类型Service使用pass-through能力
健康检查使用UDP协议的安全组规则说明
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
使用Annotation配置ELB Ingress
ELB Ingress配置HTTPS证书
ELB Ingress配置服务器名称指示(SNI)
ELB Ingress路由到多个服务
ELB Ingress配置URL重定向
ELB Ingress配置Rewrite重写
ELB Ingress配置超时时间
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
使用Annotation配置Nginx Ingress
Nginx Ingress配置HTTPS证书
Nginx Ingress配置重定向规则
Nginx Ingress配置URL重写规则
Nginx Ingress对接HTTPS协议的后端服务
Nginx Ingress使用一致性哈希负载均衡
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
使用NodeLocal DNSCache提升DNS性能
容器网络配置
主机网络(hostNetwork)
为Pod配置QoS
容器隧道网络配置
网络策略(NetworkPolicy)
集群网络配置
扩展集群VPC网段
切换节点子网
扩展集群容器网段
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
有状态负载动态挂载云硬盘存储
快照与备份
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
有状态负载动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
日志中心
日志中心概述
收集容器日志
通过ICAgent采集容器日志
可观测性最佳实践
使用云原生监控插件监控自定义指标
使用AOM监控自定义指标
使用Prometheus监控Master节点组件指标
监控NGINX Ingress控制器指标
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
HPA策略
CronHPA定时策略
CustomedHPA策略
管理工作负载伸缩策略
节点弹性伸缩
节点伸缩原理
创建节点弹性策略
管理节点弹性策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
插件
插件概述
CoreDNS域名解析
CCE容器存储(Everest)
CCE节点故障检测
Kubernetes Dashboard
CCE集群弹性引擎
NGINX Ingress控制器
Kubernetes Metrics Server
CCE容器弹性引擎
CCE AI套件(NVIDIA GPU)
CCE AI套件(Ascend NPU)
Volcano调度器
节点本地域名解析加速
云原生监控插件
云原生日志采集插件
Grafana
Prometheus
模板(Helm Chart)
概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
ServiceAccount Token安全性提升说明
常见问题
高频常见问题
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
集群删除之后相关数据能否再次找回?
集群删除
集群删除失败:安全组中存在残留资源
冻结或不可用的集群删除后如何清除残留资源
节点
节点创建
CCE集群新增节点时的问题与排查方法?
CCE集群纳管节点时的常见问题及排查方法?
纳管节点时失败,报错“安装节点失败”
节点运行
集群可用,但节点状态为“不可用”?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
容器使用SCSI类型云硬盘偶现IO卡住
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
GPU节点使用nvidia驱动启动容器排查思路
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
操作系统问题说明
CCE集群IPVS转发模式下conn_reuse_mode问题说明
节点池
节点池一直在扩容中,但“操作记录”里却没有创建节点的记录?
节点池扩容失败
工作负载
工作负载异常
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
CCE启动实例失败时的重试机制是怎样的?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
为什么Pod调度不到某个节点上?
CCE集群中工作负载镜像的拉取策略?
下载镜像缺少层如何解决
网络管理
网络规划
集群与虚拟私有云、子网的关系是怎样的?
集群安全组规则配置
网络异常
工作负载网络异常时,如何定位排查?
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
节点无法连接互联网(公网),如何排查定位?
NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常
安全加固
集群节点如何不暴露到公网?
如何配置集群的访问策略
其他
如何批量修改集群node节点安全组?
存储管理
CCE支持的存储在持久化和多节点挂载方面的区别是怎样的?
添加节点时可以不要数据盘吗?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
CCE容器云存储PVC能否感知底层存储故障?
命名空间
命名空间因APIService对象访问失败无法删除
模板插件
插件安装失败,提示The release name is already exist处理
如何根据集群规格调整插件配额
租户账号改名后,改名前上传的模板功能异常
NGINX Ingress控制器插件处于Unknown状态时卸载残留
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
参考知识
如何扩容容器的存储空间?
如何使容器重启后所在容器IP仍保持不变?
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
方案概述
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
容灾
集群高可靠推荐配置
在CCE中实现应用高可用部署
插件高可用部署
安全
CCE集群安全配置建议
CCE节点安全配置建议
在CCE集群中使用容器的安全配置建议
在CCE集群中使用密钥Secret的安全配置建议
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
监控
Prometheus监控多个集群
集群
集群选型
通过CCE搭建IPv4/IPv6双栈集群
创建节点时执行安装后脚本
通过kubectl对接多个集群
选择合适的节点数据盘大小
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
存储
存储扩容
挂载第三方租户的对象存储
自定义StorageClass
节点跨AZ时云硬盘自动拓扑(csi-disk-topology)
容器
合理分配容器计算资源
通过特权容器功能优化内核参数
使用Init容器初始化应用
使用hostAliases配置Pod /etc/hosts
容器Core Dump
权限
通过配置kubeconfig文件实现集群权限精细化管理
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
使用Nginx Ingress实现灰度发布和蓝绿发布
API参考(安卡拉区域)
使用前必读
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
变更集群规格
获取任务信息
绑定、解绑集群公网apiserver地址
获取集群访问的地址
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
纳管节点
重置节点
节点移除
节点迁移
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
存储管理
创建PVC(待废弃)
删除PVC(待废弃)
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
回滚AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
配额管理
查询CCE服务下的资源配额
API版本信息
查询API版本信息列表
标签管理
批量添加指定集群的资源标签
批量删除指定集群的资源标签
配置管理
查询指定节点池支持配置的参数列表
查询指定集群支持配置的参数列表
查询指定节点池支持配置的参数内容
修改指定节点池配置参数的值
模板管理
上传模板
获取模板列表
获取模板实例列表
更新模板
创建模板实例
删除模板
更新指定模板实例
获取模板
删除指定模板实例
下载模板
获取指定模板实例
获取模板Values
查询指定模板实例历史记录
获取用户模板配额
使用Kubernetes API
权限和授权项
附录
状态码
错误码
获取项目ID
获取账号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
数据盘空间分配说明
节点磁盘挂载
通用参考
云服务等级协议(SLA)
白皮书资源
支持区域
系统权限