全部文档
云容器引擎 CCE
云容器引擎 CCE
本产品内“
”的所有结果
本产品内“
”的所有结果
最新动态
功能总览
服务公告
最新公告
产品变更公告
集群网络、存储功能可靠性加固说明
关于CCE集群Docker支持策略公告
ServiceAccount Token安全性提升说明
Helm V2 升级Helm V3 公告
CCE集群IPVS转发模式下conn_reuse_mode问题说明
Everest插件优化密钥认证功能公告
集群版本公告
1.23版本集群停止维护公告
1.21版本集群停止维护公告
1.19版本集群停止维护公告
1.17版本集群停止维护公告
1.15版本集群停止维护公告
1.13版本集群停止维护公告
CCE不再支持1.13及之前版本集群的创建公告
Kubernetes 1.9的集群版本升级公告
漏洞公告
漏洞修复策略
runc systemd属性注入漏洞公告(CVE-2024-3154)
runc漏洞(CVE-2024-21626)对CCE服务的影响说明
Kubernetes安全漏洞公告(CVE-2022-3172)
Linux Kernel openvswitch 模块权限提升漏洞预警(CVE-2022-2639)
nginx-ingress插件安全漏洞预警公告(CVE-2021-25748)
nginx-ingress插件安全漏洞预警公告(CVE-2021-25745,CVE-2021-25746)
containerd容器进程权限提升漏洞公告(CVE-2022-24769)
CRI-O容器运行时引擎任意代码执行漏洞(CVE-2022-0811)
linux内核导致的容器逃逸漏洞公告(CVE-2022-0492)
containerd镜像Volume非安全处理漏洞公告(CVE-2022-23648)
Linux内核整数溢出漏洞(CVE-2022-0185)
Linux Polkit 权限提升漏洞预警(CVE-2021-4034)
Kubernetes subpath符号链接交换安全漏洞(CVE-2021- 25741)
runc符号链接挂载与容器逃逸漏洞预警公告(CVE-2021-30465)
Docker资源管理错误漏洞公告(CVE-2021-21285)
NVIDIA GPU驱动漏洞公告(CVE-2021-1056)
Sudo缓冲区错误漏洞公告(CVE-2021-3156)
Kubernetes安全漏洞公告(CVE-2020-8554)
Apache containerd安全漏洞公告(CVE-2020-15257)
Docker Engine输入验证错误漏洞公告(CVE-2020-13401)
Kubernetes kube-apiserver输入验证错误漏洞公告(CVE-2020-8559)
Kubernetes kubelet资源管理错误漏洞公告(CVE-2020-8557)
Kubernetes kubelet和kube-proxy授权问题漏洞公告(CVE-2020-8558)
修复Kubernetes HTTP/2漏洞公告
修复Linux内核SACK漏洞公告
修复Docker操作系统命令注入漏洞公告(CVE-2019-5736)
全面修复Kubernetes权限许可和访问控制漏洞公告(CVE-2018-1002105)
修复Kubernetes Dashboard安全漏洞公告(CVE-2018-18264)
产品发布记录
集群版本发布记录
Kubernetes版本策略
Kubernetes版本发布记录
Kubernetes 1.29版本说明
Kubernetes 1.28版本说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
(停止维护)Kubernetes 1.21版本说明
(停止维护)Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
(停止维护)Kubernetes 1.15版本说明
(停止维护)Kubernetes 1.13版本说明
(停止维护)Kubernetes 1.11版本说明
(停止维护)Kubernetes 1.9及之前版本说明
补丁版本发布记录
操作系统镜像发布记录
操作系统版本支持机制
操作系统镜像版本说明
插件版本发布记录
CoreDNS域名解析插件版本发布记录
CCE容器存储插件(Everest)版本发布记录
CCE节点故障检测插件版本发布记录
Kubernetes Dashboard插件版本发布记录
CCE集群弹性引擎版本发布记录
NGINX Ingress控制器插件版本发布记录
Kubernetes Metrics Server插件版本发布记录
CCE容器弹性引擎插件版本发布记录
CCE突发弹性引擎(对接CCI)插件版本发布记录
CCE AI套件(NVIDIA GPU)版本发布记录
CCE AI套件(Ascend NPU)版本发布记录
Volcano调度器版本发布记录
CCE密钥管理(对接 DEW)插件版本发布记录
CCE容器网络扩展指标插件版本发布记录
节点本地域名解析加速插件版本发布记录
云原生监控插件版本发布记录
云原生日志采集插件版本发布记录
Grafana插件版本发布记录
CCE集群备份恢复插件版本发布记录(停止维护)
Kubernetes Web终端版本发布记录(停止维护)
Prometheus插件版本发布记录(停止维护)
产品介绍
图解云容器引擎
什么是云容器引擎
产品优势
应用场景
容器应用管理
秒级弹性伸缩
微服务流量治理
DevOps持续交付
混合云
高性能调度
安全
责任共担
数据保护技术
审计与日志
监控安全风险
认证证书
约束与限制
计费说明
权限管理
与其它云服务的关系
区域与可用区
计费说明
计费概述
计费项
计费模式
计费模式概述
包年/包月
按需计费
计费样例
变更规格
变更计费模式
变更计费模式概述
按需转包年/包月
包年/包月转按需
续费
续费概述
手动续费
自动续费
费用账单
欠费说明
停止计费
计费FAQ
Kubernetes基础知识
概述
容器与Kubernetes
容器
Kubernetes
使用Kubectl命令操作集群
Pod、Label和Namespace
Pod:Kubernetes中的最小调度对象
存活探针(Liveness Probe)
Label:组织Pod的利器
Namespace:资源分组
Pod的编排与调度
Deployment
StatefulSet
Job和CronJob
DaemonSet
亲和与反亲和调度
配置管理
ConfigMap
Secret
Kubernetes网络
容器网络
Service
Ingress
就绪探针(Readiness Probe)
NetworkPolicy
持久化存储
Volume
PV、PVC和StorageClass
认证与授权
ServiceAccount
RBAC
弹性伸缩
快速入门
入门指引
准备工作
快速创建Kubernetes集群
创建无状态工作负载(Nginx)
部署有依赖关系的WordPress和MySQL
概述
步骤1:创建MySQL
步骤2:创建WordPress
通过Helm部署WordPress
用户指南
用户指南指引
集群类型对比
Standard和Turbo集群用户指南
高危操作及解决方案
集群
集群概述
集群基本信息
Kubernetes版本发布记录
Kubernetes 1.29版本说明
Kubernetes 1.28版本说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
(停止维护)Kubernetes 1.21版本说明
(停止维护)Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
(停止维护)Kubernetes 1.15版本说明
(停止维护)Kubernetes 1.13版本说明
(停止维护)Kubernetes 1.11版本说明
(停止维护)Kubernetes 1.9及之前版本说明
补丁版本发布记录
购买集群
集群类型对比
购买Standard/Turbo集群
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过CloudShell连接集群
通过X509证书连接集群
通过自定义域名访问集群
升级集群
升级概述
升级前须知
升级后验证
集群状态检查
节点状态检查
跳过节点检查
业务检查
新建节点检查
新建Pod检查
集群跨版本业务迁移
升级前检查异常问题排查
升级前检查项
节点限制检查
升级管控检查
插件检查
Helm模板检查
Master节点SSH联通性检查
节点池检查
安全组检查
残留待迁移节点检查
K8s废弃资源检查
兼容性风险检查
节点CCE Agent版本检查
节点CPU使用率检查
CRD检查
节点磁盘检查
节点DNS检查
节点关键目录文件权限检查
节点Kubelet检查
节点内存检查
节点时钟同步服务器检查
节点OS检查
节点CPU数量检查
节点Python命令检查
ASM网格版本检查
节点Ready检查
节点journald检查
节点干扰ContainerdSock检查
内部错误
节点挂载点检查
K8s节点污点检查
everest插件版本限制检查
cce-hpa-controller插件限制检查
增强型CPU管理策略检查
用户节点组件健康检查
控制节点组件健康检查
K8s组件内存资源限制检查
K8s废弃API检查
节点NetworkManager检查
节点ID文件检查
节点配置一致性检查
节点配置文件检查
CoreDNS配置一致性检查
节点Sudo检查
节点关键命令检查
节点sock文件挂载检查
HTTPS类型负载均衡证书一致性检查
节点挂载检查
节点paas用户登录权限检查
ELB IPv4私网地址检查
检查历史升级记录是否满足升级条件
检查集群管理平面网段是否与主干配置一致
GPU插件检查
节点系统参数检查
残留packageversion检查
节点命令行检查
节点交换区检查
nginx-ingress插件升级检查
云原生监控插件升级检查
Containerd Pod重启风险检查
GPU插件关键参数检查
GPU/NPU Pod重建风险检查
ELB监听器访问控制配置项检查
Master节点规格检查
Master节点子网配额检查
节点运行时检查
节点池运行时检查
检查节点镜像数量
管理集群
集群配置管理
集群过载控制
变更集群规格
更改集群节点的默认安全组
删除集群
休眠与唤醒集群(按需计费)
续费集群(包年/包月)
按需转包周期
节点
节点概述
容器引擎
节点操作系统
创建节点
纳管节点
登录节点
管理节点
管理节点标签
管理节点污点(Taint)
重置节点
移除节点
同步云服务器
节点排水
删除节点
按需节点转包年/包月
包年/包月节点修改自动续费配置
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
数据盘空间分配说明
节点可创建的最大Pod数量说明
将节点容器引擎从Docker迁移到Containerd
节点系统参数优化
节点系统参数可优化列表
修改节点日志缓存内存占用量上限RuntimeMaxUse
修改最大文件句柄数
修改节点内核参数
修改节点进程 ID数量上限kernel.pid_max
节点故障检测策略
节点池
节点池概述
创建节点池
管理节点池
更新节点池
更新弹性伸缩配置
节点池配置管理
复制节点池
同步节点池
升级操作系统
包年/包月节点池修改自动续费配置
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
容器设置
安全运行时与普通运行时
时区同步
配置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
性能管理配置(性能瓶颈分析)
工作负载升级策略
调度策略(亲和与反亲和)
容忍策略
标签与注解
登录容器
管理工作负载和任务
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
调度
调度概述
CPU调度
CPU管理策略
增强型CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
GPU虚拟化
GPU虚拟化概述
准备GPU虚拟化资源
使用GPU虚拟化
兼容Kubernetes默认GPU调度模式
监控GPU资源指标
基于GPU监控指标的弹性伸缩实践
GPU故障处理
NPU调度
Volcano调度
Volcano调度概述
使用Volcano调度工作负载
资源利用率优化调度
装箱调度(Binpack)
重调度(Descheduler)
节点池亲和性调度
负载感知调度
资源利用率优化调度配置案例
业务优先级保障调度
优先级调度与抢占
AI任务性能增强调度
公平调度(DRF)
组调度(Gang)
NUMA亲和性调度
应用扩缩容优先级策略
云原生混部
动态资源超卖
CPU Burst弹性限流
出口网络带宽保障
网络
网络概述
容器网络模型
容器网络模型对比
容器隧道网络
VPC网络
云原生网络2.0
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡
Service配置HTTP/HTTPS协议
Service配置服务器名称指示(SNI)
Service配置HTTP/2
Service配置HTTP/HTTPS头字段
Service配置超时时间
Service配置TLS
Service配置gzip数据压缩
Service配置黑名单/白名单访问策略
Service指定多个端口配置健康检查
通过ELB健康检查设置Pod就绪状态
LoadBalancer类型Service使用pass-through能力
健康检查使用UDP协议的安全组规则说明
DNAT网关(DNAT)
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
使用Annotation配置ELB Ingress
ELB Ingress配置HTTPS证书
ELB Ingress配置服务器名称指示(SNI)
ELB Ingress路由到多个服务
ELB Ingress配置HTTP/2
ELB Ingress配置URL重定向
ELB Ingress配置Rewrite重写
ELB Ingress配置HTTP重定向到HTTPS
ELB Ingress对接HTTPS协议的后端服务
ELB Ingress对接GRPC协议的后端服务
ELB Ingress配置HTTP/HTTPS头字段
ELB Ingress配置超时时间
ELB Ingress配置gzip数据压缩
ELB Ingress配置灰度发布
ELB Ingress配置黑名单/白名单访问策略
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
使用Annotation配置Nginx Ingress
Nginx Ingress配置HTTPS证书
Nginx Ingress配置重定向规则
Nginx Ingress配置URL重写规则
Nginx Ingress对接HTTPS协议的后端服务
Nginx Ingress使用一致性哈希负载均衡
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
使用NodeLocal DNSCache提升DNS性能
容器网络配置
主机网络(hostNetwork)
为Pod配置QoS
容器隧道网络配置
网络策略(NetworkPolicy)
云原生网络2.0配置
为工作负载绑定自定义安全组
为命名空间/工作负载绑定子网及安全组
为Pod配置固定IP
为Pod配置EIP
为Pod配置固定EIP
集群网络配置
扩展集群VPC网段
切换节点子网
扩展集群容器网段
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
有状态负载动态挂载云硬盘存储
快照与备份
文件存储(SFS)
文件存储概述
通过静态存储卷使用已有文件存储
通过动态存储卷使用文件存储
设置文件存储挂载参数
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
通过动态存储卷使用SFS Turbo子目录(推荐)
通过StorageClass动态创建SFS Turbo子目录
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
跨区域使用OBS桶
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
有状态负载动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
可观测性体系概述
健康中心
健康中心概述
使用健康中心
诊断项及修复方案
监控中心
监控中心概述
开通监控中心
容器洞察
集群
节点
工作负载
Pod
事件
仪表盘
使用仪表盘
视图指标说明
集群视图
APIServer视图
Pod视图
主机视图
Node视图
节点池视图
GPU视图
XGPU视图
CoreDNS视图
PVC视图
Kubelet视图
Prometheus Server视图
Prometheus Agent视图
日志中心
日志中心概述
收集容器日志
通过云原生日志采集插件采集容器日志
通过ICAgent采集容器日志(不推荐)
收集控制面组件日志
收集Kubernetes审计日志
收集Kubernetes事件
告警中心
告警中心概述
通过告警中心一键配置告警
通过CCE配置自定义告警
通过AOM配置自定义告警
可观测性最佳实践
使用云原生监控插件监控自定义指标
使用AOM监控自定义指标
使用Prometheus监控Master节点组件指标
监控NGINX Ingress控制器指标
监控CCE Turbo集群容器网络扩展指标
云审计服务
云审计服务支持的CCE操作列表
查询审计事件
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
HPA策略
CronHPA定时策略
CustomedHPA策略
管理工作负载伸缩策略
节点弹性伸缩
节点伸缩原理
创建节点弹性策略
管理节点弹性策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
CCE容器实例弹性伸缩到CCI服务
插件
插件概述
CoreDNS域名解析
CCE容器存储(Everest)
CCE节点故障检测
Kubernetes Dashboard
CCE集群弹性引擎
NGINX Ingress控制器
Kubernetes Metrics Server
CCE容器弹性引擎
CCE突发弹性引擎(对接CCI)
CCE AI套件(NVIDIA GPU)
CCE AI套件(Ascend NPU)
Volcano调度器
CCE密钥管理(对接 DEW)
CCE容器网络扩展指标
节点本地域名解析加速
云原生监控插件
云原生日志采集插件
Grafana
CCE集群备份恢复(停止维护)
Kubernetes Web终端(停止维护)
Prometheus(停止维护)
CCE容器存储(Flexvolume,已废弃)
模板(Helm Chart)
概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
ServiceAccount Token安全性提升说明
系统委托说明
存储管理-Flexvolume(已弃用)
存储Flexvolume概述
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型
云硬盘存储卷
云硬盘存储卷概述
使用kubectl自动创建云硬盘
使用kubectl对接已有云硬盘
使用kubectl部署带云硬盘存储卷的工作负载
极速文件存储卷
极速文件存储卷概述
使用kubectl对接已有极速文件存储卷
使用kubectl部署带极速文件存储卷的无状态工作负载
使用kubectl部署带极速文件存储卷的有状态工作负载
对象存储卷
对象存储卷概述
使用kubectl自动创建对象存储
使用kubectl对接已有对象存储
使用kubectl部署带对象存储卷的无状态工作负载
使用kubectl部署带对象存储卷的有状态工作负载
文件存储卷
文件存储卷概述
使用kubectl自动创建文件存储
使用kubectl对接已有文件存储
使用kubectl部署带文件存储卷的无状态工作负载
使用kubectl部署带文件存储卷的有状态工作负载
Autopilot集群用户指南
什么是Autopilot集群
Autopilot集群计费说明
集群
Kubernetes版本发布记录
Kubernetes 1.28版本说明
Kubernetes 1.27版本说明
Autopilot集群版本发布说明
购买Autopilot集群
连接集群
通过kubectl连接集群
通过CloudShell连接集群
通过X509证书连接集群
管理集群
删除集群
工作负载
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建普通任务(Job)
创建定时任务(CronJob)
容器设置
配置镜像拉取策略
使用第三方镜像
设置容器生命周期
设置容器健康检查
设置环境变量
工作负载升级策略
标签与注解
设置可用区亲和性
登录容器
管理工作负载和任务
管理内核参数配置
管理自定义资源
配置访问SWR和OBS服务的VPC终端节点
工作负载FAQ
网络
服务(Service)
集群内访问(ClusterIP)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
健康检查使用UDP协议的安全组规则说明
Headless Service
路由(Ingress)
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
容器网络配置
为Pod配置EIP
为Pod配置固定EIP
从容器访问公网
网络管理FAQ
集群安全组规则
存储
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
SFS Turbo动态创建子目录并挂载
临时路径(EmptyDir)
可观测性
监控中心
开通监控中心
容器洞察
集群
工作负载
Pod
仪表盘
使用仪表盘
日志中心
收集容器日志
收集Kubernetes事件
告警中心
告警中心概述
通过告警中心一键配置告警
通过CCE配置自定义告警
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
弹性伸缩
工作负载弹性伸缩
工作负载伸缩原理
HPA策略
CronHPA定时策略
管理工作负载伸缩策略
插件
CoreDNS域名解析
Kubernetes Metrics Server
云原生监控插件
云原生日志采集插件
NGINX Ingress控制器
CCE容器弹性引擎
模板(Helm Chart)
使用模板时的API资源限制
通过模板部署应用
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
方案概述
资源与成本规划
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
迁移
容器镜像迁移
方案概述
使用docker命令迁移镜像至SWR
使用image-syncer迁移镜像至SWR
跨云Harbor同步镜像至华为云SWR
将K8s集群迁移到CCE
方案概述
目标集群资源规划
实施步骤
集群外资源迁移
迁移工具安装
集群内资源迁移(Velero)
资源更新适配
其余工作
异常排查及解决
DevOps
Jenkins安装部署及对接SWR和CCE集群
方案概述
资源和成本规划
实施步骤
Jenkins Master安装部署
Jenkins Agent配置
使用Jenkins构建流水线
参考:Jenkins对接Kubernetes集群的RBAC
Gitlab对接SWR和CCE执行CI/CD
容灾
集群高可靠推荐配置
在CCE中实现应用高可用部署
插件高可用部署
安全
CCE集群选用建议
集群安全配置
节点安全配置
容器安全配置
密钥Secret安全配置
工作负载Identity
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
CCE容器实例弹性伸缩到CCI服务
基于ELB监控指标的弹性伸缩实践
监控
Prometheus监控多个集群
使用dcgm-exporter监控GPU指标
集群
集群选型
通过CCE搭建IPv4/IPv6双栈集群
制作CCE节点自定义镜像
创建节点时执行安装前/后脚本
创建节点注入脚本最佳实践
通过kubectl对接多个集群
选择合适的节点数据盘大小
集群视角成本可视化
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
容器与IDC借助VPC+云专线进行网络通信
自建IDC与CCE集群共享域名解析
方案概述
通过DNS Endpoint做级联解析
修改CoreDNS配置直接解析
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
通过配置容器内核参数增大监听队列长度
LoadBalancer类型Service使用pass-through能力
通过模板包部署Nginx Ingress Controller
自定义部署Nginx Ingress Controller
Nginx Ingress Controller高级配置
CoreDNS配置优化实践
概述
客户端
优化域名解析请求
选择合适的镜像
避免IPVS缺陷导致的DNS概率性解析超时
使用节点DNS缓存NodeLocal DNSCache
及时升级集群中的CoreDNS版本
谨慎调整VPC和虚拟机的DNS配置
服务端
监控CoreDNS运行状态
调整CoreDNS部署状态
合理配置CoreDNS
CCE Turbo配置容器网卡动态预热
集群通过企业路由器连接对端VPC
存储
存储扩容
挂载第三方租户的对象存储
通过StorageClass动态创建SFS Turbo子目录
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型
OBS并行文件系统使用指导
自定义StorageClass
节点跨AZ时云硬盘自动拓扑(csi-disk-topology)
容器
合理分配容器计算资源
实现升级实例过程中的业务不中断
通过特权容器功能优化内核参数
使用Init容器初始化应用
容器与节点时区同步
容器网络带宽限制
使用hostAliases配置Pod /etc/hosts
CCE容器中域名解析的最佳实践
CCE中使用x86和ARM双架构镜像
容器Core Dump
在CCE Turbo集群中配置Pod延时启动参数
权限
通过配置kubeconfig文件实现集群权限精细化管理
集群命名空间RBAC授权
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
使用Nginx Ingress实现灰度发布和蓝绿发布
批量计算
CCE部署使用Kubeflow
Kubeflow部署
Tensorflow训练
使用Kubeflow和Volcano实现典型AI训练任务
CCE部署使用Caffe
预置条件
资源准备
Caffe分类范例
CCE部署使用Tensorflow
CCE部署使用Flink
ClickHouse on CCE部署指南
资源规划
配置kubectl工具
部署clickhouse operator
示例
Spark on CCE with OBS安装使用指南
安装Spark
使用Spark on CCE
API参考
使用前必读
概述
调用说明
终端节点(Endpoint)
约束与限制
基本概念
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
变更集群规格
获取任务信息
绑定、解绑集群公网apiserver地址
获取集群访问的地址
查询集群日志配置信息
配置集群日志
获取分区列表
创建分区
获取分区详情
更新分区
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
纳管节点
重置节点
节点移除
节点迁移
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
存储管理
创建PVC(待废弃)
删除PVC(待废弃)
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
回滚AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
集群升级
集群升级
获取集群升级任务详情
重试集群升级任务
暂停集群升级任务(已废弃)
继续执行集群升级任务(已废弃)
获取集群升级任务详情列表
集群升级前检查
获取集群升级前检查任务详情
获取集群升级前检查任务详情列表
集群升级后确认
集群备份
获取集群备份任务详情列表
获取集群升级相关信息
获取集群升级路径
获取集群升级特性开关配置
开启集群升级流程引导任务
获取UpgradeWorkFlows列表
获取指定集群升级引导任务详情
更新指定集群升级引导任务状态
配额管理
查询CCE服务下的资源配额
API版本信息
查询API版本信息列表
标签管理
批量添加指定集群的资源标签
批量删除指定集群的资源标签
配置管理
查询指定节点池支持配置的参数列表
查询指定集群支持配置的参数列表
查询指定节点池支持配置的参数内容
修改指定节点池配置参数的值
模板管理
上传模板
获取模板列表
获取模板实例列表
更新模板
创建模板实例
删除模板
更新指定模板实例
获取模板
删除指定模板实例
下载模板
获取指定模板实例
获取模板Values
查询指定模板实例历史记录
获取用户模板配额
插件实例字段说明
CCE突发弹性引擎(对接CCI)
使用Kubernetes API
历史API
获取集群证书
创建PV
删除PV
权限和授权项
附录
状态码
错误码
获取项目ID
获取账号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
数据盘空间分配说明
节点磁盘挂载
SDK参考
SDK概述
常见问题
高频常见问题
计费类
云容器引擎CCE如何定价/收费?
CCE集群的计费方式如何由按需改为包年包月?
CCE创建的节点是否支持按需转包周期?
华为云支持哪几种开具发票模式?
CCE是否支持余额不足提醒?
CCE是否支持账户余额变动提醒?
包周期的CCE集群到期可以直接删除吗?
如何退订我的云容器引擎?
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
CCE集群创建时的根证书如何更新?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
CCE集群如何重置或重装?
如何确认已创建的集群是否为多控制节点模式?
是否可以直接连接集群的控制节点?
集群删除之后相关数据能否再次找回?
为什么CCE集群界面的节点磁盘监控看起来不准确?
如何修改集群名称?
集群删除
集群删除失败:安全组中存在残留资源
冻结或不可用的集群删除后如何清除残留资源
集群升级
CCE集群升级时,升级集群插件失败如何排查解决?
节点
节点创建
CCE集群新增节点时的问题与排查方法?
CCE集群纳管节点时的常见问题及排查方法?
纳管节点时失败,报错“安装节点失败”
节点运行
集群可用,但节点状态为“不可用”?
CCE集群中的节点无法远程登录,如何排查解决?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
如何解决yum update升级操作系统导致的容器网络不可用问题?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
CCE集群节点中安装kubelet的端口主要有哪些?
如何配置Pod使用GPU节点的加速能力?
容器使用SCSI类型云硬盘偶现IO卡住
docker审计日志量过大影响磁盘IO
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
节点上监听了哪些端口
GPU节点使用nvidia驱动启动容器排查思路
节点NTP时间不同步
Containerd节点业务容器标准输出日志写入过快导致节点数据盘使用率过高
为什么kubectl top命令查看节点内存使用超过100%?
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
CCE集群的节点可以更改IP吗?
操作系统问题说明
低版本内核的CentOS节点反复创删应用时,偶现cgroup kmem泄露问题
CCE集群IPVS转发模式下conn_reuse_mode问题说明
cgroup统计资源异常导致kubelet驱逐Pod
低版本内核的CentOS节点出现容器OOM时,偶现ext4文件系统卡死问题
IPVS缺陷导致节点上升级CoreDNS后出现概率性解析超时
节点ARP表项超过限制
节点池
节点池一直在扩容中,但“操作记录”里却没有创建节点的记录?
节点池扩容失败
节点池批量扩缩容节点时,Kubernetes Event事件存在部分缺失
工作负载
工作负载异常
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
工作负载异常:实例无法写入数据
挂载文件存储的节点,Pod创建删除卡死
容器异常退出状态码
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
CCE启动实例失败时的重试机制是怎样的?
监控告警
工作负载的“事件”保存多长时间?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
如何查看Pod是否使用CPU绑核?
节点关机后Pod不重新调度
如何避免非GPU/NPU负载调度到GPU/NPU节点?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
为什么Pod调度不到某个节点上?
CCE集群中工作负载镜像的拉取策略?
鲲鹏集群Docker容器挂载点被卸载
下载镜像缺少层如何解决
容器内的文件权限和用户都是问号
网络管理
网络规划
集群与虚拟私有云、子网的关系是怎样的?
如何查看虚拟私有云VPC的网段?
如何设置CCE集群中的VPC网段和子网网段?
如何设置CCE集群中的容器网段?
什么是云原生网络2.0网络模式,适用于什么场景?
什么是弹性网卡?
集群安全组规则配置
如何设置IPv6服务网段
网络异常
工作负载网络异常时,如何定位排查?
集群内部无法使用ELB地址访问负载
集群外部访问Ingress异常
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
VPC的子网无法删除,怎么办?
如何修复出现故障的容器网卡?
节点无法连接互联网(公网),如何排查定位?
如何解决VPC网段与容器网络冲突的问题?
ELB四层健康检查导致java报错:Connection reset by peer
Service事件:Have no node to bind,如何排查?
为什么登录虚拟机VNC界面会间歇性出现Dead loop on virtual device gw_11cbf51a, fix it urgently?
集群节点使用networkpolicy概率性出现panic问题
节点远程登录界面(VNC)打印较多source ip_type日志问题
使用IE浏览器访问nginx-ingress出现重定向308无法访问
NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常
安全加固
集群节点如何不暴露到公网?
如何配置集群的访问策略
网络指导
CCE如何与其他服务进行内网通信?
使用CCE设置工作负载访问方式时,端口如何填写?
Ingress中的property字段如何实现与社区client-go兼容?
其他
如何获取TLS密钥证书?
CCE集群的节点是否支持绑定多网卡?
服务发布到ELB,ELB的后端为何会被自动删除?
为什么更换命名空间后无法创建ingress?
服务加入Istio后,如何获取客户端真实源IP?
如何批量修改集群node节点安全组?
存储管理
CCE支持的存储在持久化和多节点挂载方面的区别是怎样的?
添加节点时可以不要数据盘吗?
CCE集群使用EVS做持久卷,在卷被删除或者过期后是否可以恢复?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
弹性文件存储SFS最多可以挂载多少台节点(ECS)?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
创建存储卷失败
CCE容器云存储PVC能否感知底层存储故障?
SFS 3.0文件系统在OS中的挂载点修改属组及权限报错
无法使用kubectl命令删除PV或PVC
命名空间
命名空间因APIService对象访问失败无法删除
如何删除Terminating状态的命名空间?
模板插件
集群安装nginx-ingress插件失败,一直处于创建中?
NPD插件版本过低导致进程资源残留问题
模板格式不正确,无法删除模板实例?
CCE是否支持nginx-ingress?
插件安装失败,提示The release name is already exist处理
创建或升级实例失败,提示rendered manifests contain a resource that already exists
kube-prometheus-stack插件实例调度失败,提示node(s) had volume node affinity conflict
上传模板失败
如何根据集群规格调整插件配额
NGINX Ingress控制器插件处于Unknown状态时卸载残留
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
为什么修改子网DNS配置后,无法解析租户区域名?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
镜像仓库
如何制作Docker镜像?如何解决拉取镜像慢的问题?
如何上传我的镜像到CCE中使用?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
参考知识
如何扩容容器的存储空间?
如何使容器重启后所在容器IP仍保持不变?
云容器引擎(CCE)与云容器实例(CCI)的区别是什么?
云容器引擎CCE和微服务引擎的区别是什么?
视频帮助
更多文档
用户指南(阿布扎比区域)
产品介绍
什么是云容器引擎
产品优势
应用场景
基础设施与容器应用管理
秒级弹性伸缩
DevOps持续交付
混合云架构
约束与限制
权限管理
基本概念
基本概念
CCE与原生Kubernetes名词对照
区域与可用区
与其它云服务的关系
快速入门
入门指引
准备工作
快速创建Kubernetes集群
创建无状态工作负载(Nginx)
部署有依赖关系的WordPress和MySQL
概述
步骤1:创建MySQL
步骤2:创建WordPress
高危操作及解决方案
集群
集群概述
集群基本信息
Kubernetes版本发布说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
Kubernetes 1.21版本说明
Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
CCE集群版本发布说明
购买集群
CCE Turbo集群与CCE Standard集群的区别
购买集群
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过X509证书连接集群
通过自定义域名访问集群
升级集群
升级概述
升级前须知
原地升级
升级后验证
存量Pod检查
存量节点与容器网络检查
存量节点标签与污点检查
跳过节点检查
业务检查
新建节点检查
新建Pod检查
集群跨版本业务迁移
升级前检查异常问题排查
升级前检查项
节点限制检查
升级管控检查
插件检查
Helm模板检查
Master节点SSH联通性检查
节点池检查
安全组检查
ARM节点限制检查
残留待迁移节点检查
K8s废弃资源检查
兼容性风险检查
节点CCE Agent版本检查
节点CPU使用率检查
CRD检查
节点磁盘检查
节点DNS检查
节点关键目录文件权限检查
节点Kubelet检查
节点内存检查
节点时钟同步服务器检查
节点OS检查
节点CPU数量检查
节点Python命令检查
ASM网格版本检查
节点Ready检查
节点journald检查
节点干扰ContainerdSock检查
内部错误
节点挂载点检查
K8s节点污点检查
everest插件版本限制检查
cce-hpa-controller插件限制检查
增强型CPU管理策略检查
用户节点组件健康检查
控制节点组件健康检查
K8s组件内存资源限制检查
K8s废弃API检查
CCE Turbo集群IPv6能力检查
节点NetworkManager检查
节点ID文件检查
节点配置一致性检查
节点配置文件检查
CoreDNS配置一致性检查
节点Sudo检查
节点关键命令检查
节点sock文件挂载检查
HTTPS类型负载均衡证书一致性检查
节点挂载检查
节点paas用户登录权限检查
ELB IPv4私网地址检查
检查历史升级记录是否满足升级条件
检查集群管理平面网段是否与主干配置一致
GPU插件检查
节点系统参数检查
残留packageversion检查
节点命令行检查
节点交换区检查
nginx-ingress插件升级检查
管理集群
集群配置管理
集群过载控制
变更集群规格
更改集群节点的默认安全组
删除集群
休眠与唤醒集群
节点
节点概述
容器引擎
创建节点
纳管节点
登录节点
管理节点
管理节点标签
管理节点污点(Taint)
重置节点
移除节点
同步云服务器
节点排水
删除节点
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
数据盘空间分配说明
节点可创建的最大Pod数量说明
将节点容器引擎从Docker迁移到Containerd
节点故障检测策略
节点池
节点池概述
创建节点池
管理节点池
更新节点池
更新弹性伸缩配置
节点池配置管理
拷贝节点池
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
容器设置
时区同步
配置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
性能管理配置(性能瓶颈分析)
工作负载升级策略
调度策略(亲和与反亲和)
容忍策略
标签与注解
登录容器
管理工作负载和任务
安全运行时与普通运行时
调度
调度概述
CPU调度
CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
NPU调度
Volcano调度
Volcano调度概述
使用Volcano调度工作负载
资源利用率优化调度
装箱调度(Binpack)
重调度(Descheduler)
节点池亲和性调度
AI任务性能增强调度
公平调度(DRF)
组调度(Gang)
NUMA亲和性调度
网络
网络概述
容器网络模型
容器网络模型对比
容器隧道网络
VPC网络
云原生网络2.0
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡
Service使用HTTP/HTTPS协议
指定多个端口配置健康检查
通过ELB健康检查设置Pod就绪状态
负载均衡类型的服务设置超时时间
LoadBalancer类型Service使用pass-through能力
健康检查使用UDP协议的安全组规则说明
DNAT网关(DNAT)
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
使用Annotation配置ELB Ingress
ELB Ingress配置HTTPS证书
ELB Ingress配置服务器名称指示(SNI)
ELB Ingress路由到多个服务
ELB Ingress使用HTTP/2
ELB Ingress对接HTTPS协议的后端服务
ELB Ingress设置超时时间
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
使用Annotation配置Nginx Ingress
Nginx Ingress配置HTTPS证书
Nginx Ingress配置URL重写规则
Nginx Ingress对接HTTPS协议的后端服务
Nginx Ingress使用一致性哈希负载均衡
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
使用NodeLocal DNSCache提升DNS性能
容器网络配置
主机网络(hostNetwork)
为Pod配置QoS
容器隧道网络配置
网络策略(NetworkPolicy)
云原生网络2.0配置
安全组策略(SecurityGroup)
容器网络配置(NetworkAttachmentDefinition)
集群网络配置
切换节点子网
扩展集群容器网段
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
有状态负载动态挂载云硬盘存储
快照与备份
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
SFS Turbo动态创建子目录并挂载
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
有状态负载动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
日志中心
日志中心概述
收集数据面日志
容器日志对接AOM
可观测性最佳实践
使用Prometheus监控自定义指标
使用AOM监控自定义指标
云审计服务
云审计服务支持的CCE操作列表
查询审计事件
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
HPA策略
CronHPA定时策略
CustomedHPA策略
管理工作负载伸缩策略
节点弹性伸缩
节点伸缩原理
创建节点伸缩策略
管理节点伸缩策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
插件
插件概述
CoreDNS域名解析
CCE容器存储(Everest)
CCE节点故障检测
Kubernetes Dashboard
CCE集群弹性引擎
NGINX Ingress控制器
Kubernetes Metrics Server
CCE容器弹性引擎
CCE AI套件(NVIDIA GPU)
CCE AI套件(Ascend NPU)
Volcano调度器
CCE密钥管理(对接 DEW)
CCE容器网络扩展指标
节点本地域名解析加速
Prometheus
模板(Helm Chart)
概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
ServiceAccount Token安全性提升说明
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
方案概述
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
容灾
在CCE中实现应用高可用部署
安全
集群安全配置
节点安全配置
容器安全配置
密钥Secret安全配置
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
监控
Prometheus监控多个集群
集群
制作CCE节点自定义镜像
创建节点时执行安装后脚本
通过kubectl对接多个集群
选择合适的节点数据盘大小
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
通过模板包部署Nginx Ingress Controller
部署多个Nginx Ingress Controller
Nginx Ingress Controller高级配置
CCE Turbo配置容器网卡动态预热
存储
存储扩容
挂载第三方租户的对象存储
SFS Turbo动态创建子目录并挂载
自定义StorageClass
节点跨AZ时云硬盘自动拓扑(csi-disk-topology)
容器
合理分配容器计算资源
通过特权容器功能优化内核参数
使用Init容器初始化应用
使用hostAliases配置Pod /etc/hosts
容器Core Dump
权限
通过配置kubeconfig文件实现集群权限精细化管理
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
使用Nginx Ingress实现灰度发布和蓝绿发布
常见问题
高频常见问题
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
集群删除之后相关数据能否再次找回?
集群删除
集群删除失败:弹性网卡残留
冻结或不可用的集群删除后如何清除残留资源
集群升级
CCE集群升级时,升级集群插件失败如何排查解决?
节点
节点创建
CCE集群新增节点时的问题与排查方法?
节点运行
集群可用,但节点状态为“不可用”?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
容器使用SCSI类型云硬盘偶现IO卡住
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
GPU节点使用nvidia驱动启动容器排查思路
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
节点池
节点池一直在扩容中,但“操作记录”里却没有创建节点的记录?
工作负载
工作负载异常
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
Dockerfile中ENTRYPOINT指定JVM启动堆内存参数后部署容器启动报错?
CCE启动实例失败时的重试机制是怎样的?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
为什么Pod调度不到某个节点上?
CCE集群中工作负载镜像的拉取策略?
下载镜像缺少层如何解决
网络管理
网络规划
集群与虚拟私有云、子网的关系是怎样的?
集群安全组规则配置
网络异常
工作负载网络异常时,如何定位排查?
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
节点无法连接互联网(公网),如何排查定位?
其他
如何批量修改集群node节点安全组?
存储管理
CCE支持的存储在持久化和多节点挂载方面的区别是怎样的?
添加节点时可以不要数据盘吗?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
CCE容器云存储PVC能否感知底层存储故障?
命名空间
命名空间因APIService对象访问失败无法删除
模板插件
插件安装失败,提示The release name is already exist处理
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
镜像仓库
如何上传我的镜像到CCE中使用?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
参考知识
如何扩容容器的存储空间?
如何使容器重启后所在容器IP仍保持不变?
API参考(阿布扎比区域)
使用前必读
概述
调用说明
终端节点(Endpoint)
约束与限制
基本概念
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
获取任务信息
绑定、解绑集群公网apiserver地址
获取集群访问的地址
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
纳管节点
重置节点
节点移除
节点迁移
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
存储管理
创建PVC(待废弃)
删除PVC(待废弃)
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
配额管理
查询CCE服务下的资源配额
API版本信息
查询API版本信息列表
使用Kubernetes API
权限和授权项
附录
状态码
错误码
获取项目ID
获取帐号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
数据盘空间分配说明
节点磁盘挂载
修订记录
用户指南(巴黎区域)
产品介绍
什么是云容器引擎
产品优势
应用场景
基础设施与容器应用管理
秒级弹性伸缩
DevOps持续交付
混合云架构
约束与限制
权限管理
计费说明
基本概念
基本概念
CCE与原生Kubernetes名词对照
CCE Turbo集群
区域与可用区
与其它云服务的关系
产品公告
集群节点高危操作
CCE安全使用指引
集群节点操作系统补丁说明
漏洞公告
Kubernetes安全漏洞公告(CVE-2022-3172)
Linux Kernel openvswitch 模块权限提升漏洞预警(CVE-2022-2639)
CRI-O容器运行时引擎任意代码执行漏洞(CVE-2022-0811)
linux内核导致的容器逃逸漏洞公告(CVE-2022-0492)
Linux内核整数溢出漏洞(CVE-2022-0185)
Kubernetes基础知识
概述
容器与Kubernetes
容器
Kubernetes
Pod、Label和Namespace
Pod:Kubernetes中的最小调度对象
存活探针(Liveness Probe)
Label:组织Pod的利器
Namespace:资源分组
Pod的编排与调度
Deployment
StatefulSet
Job和CronJob
DaemonSet
亲和与反亲和调度
配置管理
ConfigMap
Secret
Kubernetes网络
容器网络
Service
Ingress
就绪探针(Readiness Probe)
NetworkPolicy
持久化存储
Volume
PV、PVC和StorageClass
认证与授权
ServiceAccount
RBAC
弹性伸缩
快速入门
入门指引
准备工作
快速创建Kubernetes集群
镜像创建无状态工作负载(Nginx)
部署有依赖关系的WordPress和MySQL
概述
步骤1:创建MySQL
步骤2:创建WordPress
高危操作及解决方案
集群
集群概述
集群基本信息
Kubernetes版本发布说明
Kubernetes 1.27版本说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
Kubernetes 1.21版本说明
Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
CCE集群版本发布说明
创建集群
CCE Turbo集群与CCE集群的区别
创建集群
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过X509证书连接集群
通过自定义域名访问集群
升级集群
升级概述
升级前须知
原地升级
升级后验证
业务验证
存量Pod检查
存量节点与容器网络检查
存量节点标签与污点检查
新建节点检查
新建Pod检查
跳过节点检查
集群跨版本业务迁移
升级前检查异常问题排查
升级前检查项
节点限制检查
升级管控检查
插件检查
Helm模板检查
Master节点SSH联通性检查
节点池检查
安全组检查
ARM节点限制检查
残留待迁移节点检查
K8s废弃资源检查
兼容性风险检查
节点CCE Agent版本检查
节点CPU使用率检查
CRD检查
节点磁盘检查
节点DNS检查
节点关键目录文件权限检查
节点Kubelet检查
节点内存检查
节点时钟同步服务器检查
节点OS检查
节点CPU数量检查
节点Python命令检查
ASM网格版本检查
节点Ready检查
节点journald检查
节点干扰ContainerdSock检查
内部错误
节点挂载点检查
K8s节点污点检查
everest插件版本限制检查
cce-hpa-controller插件限制检查
增强型CPU管理策略检查
用户节点组件健康检查
控制节点组件健康检查
K8s组件内存资源限制检查
K8s废弃API检查
CCE Turbo集群IPv6能力检查
节点NetworkManager检查
节点ID文件检查
节点配置一致性检查
节点配置文件检查
CoreDNS配置一致性检查
节点Sudo检查
节点关键命令检查
节点sock文件挂载检查
HTTPS类型负载均衡证书一致性检查
节点挂载检查
节点paas用户登录权限检查
ELB IPv4私网地址检查
检查历史升级记录是否满足升级条件
检查集群管理平面网段是否与主干配置一致
GPU插件检查
节点系统参数检查
残留packageversion检查
节点命令行检查
节点交换区检查
nginx-ingress插件升级检查
管理集群
集群配置管理
集群过载控制
变更集群规格
删除集群
休眠与唤醒集群
节点
节点概述
容器引擎
创建节点
纳管节点
登录节点
管理节点
管理节点标签
管理节点污点(Taint)
重置节点
移除节点
同步云服务器
删除节点
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
数据盘空间分配说明
节点可创建的最大Pod数量说明
将节点容器引擎从Docker迁移到Containerd
节点故障检测策略
节点池
节点池概述
创建节点池
管理节点池
更新节点池
节点池配置管理
拷贝节点池
同步节点池
升级操作系统
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
容器设置
时区同步
配置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
工作负载升级策略
调度策略(亲和与反亲和)
容忍策略
标签与注解
登录容器
管理工作负载和任务
调度
调度概述
CPU调度
CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
volcano调度
NUMA亲和性调度
网络
网络概述
容器网络模型
容器网络模型对比
容器隧道网络
VPC网络
云原生网络2.0
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡
Service使用HTTP协议
指定多个端口配置健康检查
负载均衡类型的服务设置超时时间
LoadBalancer类型Service使用pass-through能力
健康检查使用UDP协议的安全组规则说明
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
使用Annotation配置ELB Ingress
ELB Ingress配置HTTPS证书
ELB Ingress配置服务器名称指示(SNI)
ELB Ingress路由到多个服务
ELB Ingress使用HTTP/2
ELB Ingress对接HTTPS协议的后端服务
ELB Ingress设置超时时间
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
Nginx Ingress配置HTTPS证书
Nginx Ingress配置URL重写规则
Nginx Ingress对接HTTPS协议的后端服务
Nginx Ingress使用一致性哈希负载均衡
使用Annotation配置Nginx Ingress
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
容器网络配置
主机网络(hostNetwork)
Pod互访QoS限速
容器隧道网络配置
网络策略(NetworkPolicy)
云原生网络2.0配置
安全组策略(SecurityGroup)
网络配置(NetworkAttachmentDefinition)
集群网络配置
切换节点子网
扩展集群容器网段
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
有状态负载动态挂载云硬盘存储
快照与备份
文件存储(SFS)
文件存储概述
通过静态存储卷使用已有文件存储
通过动态存储卷使用文件存储
设置文件存储挂载参数
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
SFS Turbo动态创建子目录并挂载
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
有状态负载动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
日志管理
日志概述
使用ICAgent采集容器日志
监控管理
监控概述
使用AOM监控自定义指标
云审计日志
云审计服务支持的CCE操作列表
查询审计事件
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
HPA策略
管理工作负载伸缩策略
节点弹性伸缩
节点伸缩原理
创建节点伸缩策略
管理节点伸缩策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
插件
插件概述
CoreDNS
CCE Container Storage (Everest)
npd
CCE Cluster Autoscaler
NGNIX Ingress Controller
Kubernetes Metrics Server
gpu-device-plugin
Volcano Scheduler
CCE Container Storage (FlexVolume)
模板(Helm Chart)
概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
ServiceAccount Token安全性提升说明
常见问题
高频常见问题
计费类
云容器引擎CCE如何定价/收费?
CCE是否支持余额不足提醒?
CCE是否支持账户余额变动提醒?
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
集群删除之后相关数据能否再次找回?
集群删除
集群删除失败:弹性网卡残留
冻结或不可用的集群删除后如何清除残留资源
集群升级
CCE集群升级时,升级集群插件失败如何排查解决?
节点
节点创建
CCE集群新增节点时的问题与排查方法?
节点运行
集群可用,但节点状态为“不可用”?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
容器使用SCSI类型云硬盘偶现IO卡住
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
GPU节点使用nvidia驱动启动容器排查思路
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
节点池
节点池一直在扩容中,但“操作记录”里却没有创建节点的记录?
工作负载
工作负载异常
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
实例网络空间更新,报sandbox相关错,如何处理?
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
Dockerfile中ENTRYPOINT指定JVM启动堆内存参数后部署容器启动报错?
CCE启动实例失败时的重试机制是怎样的?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
为什么Pod调度不到某个节点上?
CCE集群中工作负载镜像的拉取策略?
下载镜像缺少层如何解决
网络管理
网络规划
集群与虚拟私有云、子网的关系是怎样的?
集群安全组规则配置
网络异常
工作负载网络异常时,如何定位排查?
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
节点无法连接互联网(公网),如何排查定位?
NGINX Ingress控制器插件升级导致集群内Nginx类型的Ingress路由访问异常
存储管理
CCE支持的存储在持久化和多节点挂载方面的区别是怎样的?
添加节点时可以不要数据盘吗?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
CCE容器云存储PVC能否感知底层存储故障?
命名空间
命名空间因APIService对象访问失败无法删除
模板插件
插件安装失败,提示The release name is already exist处理
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
镜像仓库
如何上传我的镜像到CCE中使用?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
参考知识
如何扩容容器的存储空间?
如何使容器重启后所在容器IP仍保持不变?
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
方案概述
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
容灾
在CCE中实现应用高可用部署
安全
集群安全配置
节点安全配置
容器安全配置
密钥Secret安全配置
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
监控
Prometheus监控多个集群
集群
通过kubectl对接多个集群
选择合适的节点数据盘大小
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
存储
存储扩容
挂载第三方租户的对象存储
SFS Turbo动态创建子目录并挂载
1.15集群如何从Flexvolume存储类型迁移到CSI Everest存储类型
自定义StorageClass
节点跨AZ时云硬盘自动拓扑(csi-disk-topology)
容器
合理分配容器计算资源
通过特权容器功能优化内核参数
使用Init容器初始化应用
使用hostAliases配置Pod /etc/hosts
容器Core Dump
权限
通过配置kubeconfig文件实现集群权限精细化管理
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
将老版本的数据迁移到最新版本
版本间差异
镜像迁移
迁移集群
迁移应用
通过API或kubectl创建的应用
通过组件模板创建的应用
通过设计器创建的应用
API参考 (巴黎区域)
使用前必读
概述
调用说明
终端节点(Endpoint)
约束与限制
基本概念
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
获取任务信息
绑定、解绑集群公网apiserver地址
获取集群访问的地址
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
纳管节点
重置节点
节点移除
节点迁移
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
配额管理
查询CCE服务下的资源配额
API版本信息
查询API版本信息列表
使用Kubernetes API
权限和授权项
附录
状态码
错误码
获取项目ID
获取帐号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
数据盘空间分配说明
节点磁盘挂载
修订记录
用户指南(吉隆坡区域)
产品介绍
什么是云容器引擎
产品优势
应用场景
基础设施与容器应用管理
秒级弹性伸缩
DevOps持续交付
混合云架构
约束与限制
权限管理
基本概念
基本概念
CCE与原生Kubernetes名词对照
区域与可用区
与其它云服务的关系
快速入门
入门指引
准备工作
快速创建Kubernetes集群
镜像创建无状态工作负载(Nginx)
部署有依赖关系的WordPress和MySQL
概述
步骤1:创建MySQL
步骤2:创建WordPress
高危操作及解决方案
集群
集群概述
集群基本信息
Kubernetes版本发布说明
Kubernetes 1.25版本说明
Kubernetes 1.23版本说明
Kubernetes 1.21版本说明
Kubernetes 1.19版本说明
(停止维护)Kubernetes 1.17版本说明
CCE集群版本发布说明
购买集群
购买集群
iptables与IPVS如何选择
连接集群
通过kubectl连接集群
通过X509证书连接集群
通过自定义域名访问集群
升级集群
升级概述
升级前须知
原地升级
升级后验证
业务验证
存量Pod检查
存量节点与容器网络检查
存量节点标签与污点检查
新建节点检查
新建Pod检查
跳过节点检查
集群跨版本业务迁移
升级前检查异常问题排查
升级前检查项
节点限制检查
升级管控检查
插件检查
Helm模板检查
Master节点SSH联通性检查
节点池检查
安全组检查
ARM节点限制检查
残留待迁移节点检查
K8s废弃资源检查
兼容性风险检查
节点CCE Agent版本检查
节点CPU使用率检查
CRD检查
节点磁盘检查
节点DNS检查
节点关键目录文件权限检查
节点Kubelet检查
节点内存检查
节点时钟同步服务器检查
节点OS检查
节点CPU数量检查
节点Python命令检查
ASM网格版本检查
节点Ready检查
节点journald检查
节点干扰ContainerdSock检查
内部错误
节点挂载点检查
K8s节点污点检查
everest插件版本限制检查
cce-hpa-controller插件限制检查
增强型CPU管理策略检查
用户节点组件健康检查
控制节点组件健康检查
K8s组件内存资源限制检查
K8s废弃API检查
节点NetworkManager检查
节点ID文件检查
节点配置一致性检查
节点配置文件检查
CoreDNS配置一致性检查
管理集群
集群配置管理
集群过载控制
变更集群规格
更改集群节点的默认安全组
删除集群
休眠与唤醒集群
节点
节点概述
容器引擎
创建节点
纳管节点
登录节点
管理节点
管理节点标签
管理节点污点(Taint)
重置节点
移除节点
同步云服务器
节点排水
删除节点
节点关机
节点滚动升级
节点运维
节点预留资源策略说明
数据盘空间分配说明
节点可创建的最大Pod数量说明
将节点容器引擎从Docker迁移到Containerd
节点故障检测策略
节点池
节点池概述
创建节点池
管理节点池
更新节点池
更新弹性伸缩配置
节点池配置管理
拷贝节点池
同步节点池
迁移节点
删除节点池
工作负载
工作负载概述
创建工作负载
创建无状态负载(Deployment)
创建有状态负载(StatefulSet)
创建守护进程集(DaemonSet)
创建普通任务(Job)
创建定时任务(CronJob)
容器设置
时区同步
配置镜像拉取策略
使用第三方镜像
设置容器规格
设置容器生命周期
设置容器健康检查
设置环境变量
工作负载升级策略
调度策略(亲和与反亲和)
容忍策略
标签与注解
登录容器
管理工作负载和任务
调度
调度概述
CPU调度
CPU管理策略
GPU调度
使用Kubernetes默认GPU调度
NPU调度
volcano调度
NUMA亲和性调度
云原生混部
动态资源超卖
网络
网络概述
容器网络模型
容器网络模型对比
容器隧道网络
VPC网络
服务(Service)
服务概述
集群内访问(ClusterIP)
节点访问(NodePort)
负载均衡(LoadBalancer)
创建负载均衡类型的服务
使用Annotation配置负载均衡
Service使用HTTP协议
指定多个端口配置健康检查
健康检查使用UDP协议的安全组规则说明
DNAT网关(DNAT)
Headless Service
路由(Ingress)
路由概述
ELB Ingress管理
通过控制台创建ELB Ingress
通过Kubectl命令行创建ELB Ingress
使用Annotation配置ELB Ingress
ELB Ingress配置HTTPS证书
ELB Ingress配置服务器名称指示(SNI)
ELB Ingress路由到多个服务
ELB Ingress使用HTTP/2
ELB Ingress对接HTTPS协议的后端服务
Nginx Ingress管理
通过控制台创建Nginx Ingress
通过Kubectl命令行创建Nginx Ingress
Nginx Ingress配置HTTPS证书
Nginx Ingress配置URL重写规则
Nginx Ingress对接HTTPS协议的后端服务
Nginx Ingress使用一致性哈希负载均衡
使用Annotation配置Nginx Ingress
DNS
DNS概述
工作负载DNS配置说明
使用CoreDNS实现自定义域名解析
使用NodeLocal DNSCache提升DNS性能
容器网络配置
主机网络(hostNetwork)
Pod互访QoS限速
容器隧道网络配置
网络策略(NetworkPolicy)
集群网络配置
切换节点子网
扩展集群容器网段
容器如何访问VPC内部网络
从容器访问公网
存储
存储概述
存储基础知识
云硬盘存储(EVS)
云硬盘概述
通过静态存储卷使用已有云硬盘
通过动态存储卷使用云硬盘
有状态负载动态挂载云硬盘存储
快照与备份
极速文件存储(SFS Turbo)
极速文件存储概述
通过静态存储卷使用已有极速文件存储
设置极速文件存储挂载参数
SFS Turbo动态创建子目录并挂载
对象存储(OBS)
对象存储概述
通过静态存储卷使用已有对象存储
通过动态存储卷使用对象存储
设置对象存储挂载参数
对象存储卷挂载设置自定义访问密钥(AK/SK)
本地持久卷(Local PV)
本地持久卷概述
在存储池中导入持久卷
通过动态存储卷使用本地持久卷
有状态负载动态挂载本地持久卷
临时存储卷(EmptyDir)
临时存储卷概述
在存储池中导入临时卷
使用本地临时卷
使用临时路径
主机路径(HostPath)
存储类(StorageClass)
可观测性
日志管理
日志概述
使用ICAgent采集容器日志
监控管理
监控概述
使用AOM监控自定义指标
使用Prometheus监控自定义指标
Master节点组件指标监控
云审计日志
云审计服务支持的CCE操作列表
查询审计事件
命名空间
创建命名空间
管理命名空间
设置资源配额及限制
配置项与密钥
创建配置项
使用配置项
创建密钥
使用密钥
集群系统密钥说明
弹性伸缩
弹性伸缩概述
工作负载弹性伸缩
工作负载伸缩原理
HPA策略
CustomedHPA策略
管理工作负载伸缩策略
节点弹性伸缩
节点伸缩原理
创建节点伸缩策略
管理节点伸缩策略
使用HPA+CA实现工作负载和节点联动弹性伸缩
插件
插件概述
coredns(系统资源插件,必装)
everest(系统资源插件,必装)
npd
dashboard
autoscaler
nginx-ingress
metrics-server
cce-hpa-controller
gpu-beta
huawei-npu
volcano
dew-provider
dolphin
node-local-dns
kube-prometheus-stack
web-terminal(停止维护)
prometheus
模板(Helm Chart)
概述
通过模板部署应用
Helm v2与Helm v3的差异及适配方案
通过Helm v2客户端部署应用
通过Helm v3客户端部署应用
Helm v2 Release转换成Helm v3 Release
权限
CCE权限概述
集群权限(IAM授权)
命名空间权限(Kubernetes RBAC授权)
示例:某部门权限设计及配置
CCE控制台的权限依赖
Pod安全配置
PodSecurityPolicy配置
Pod Security Admission配置
ServiceAccount Token安全性提升说明
最佳实践
容器应用部署上云CheckList
容器化改造
企业管理应用容器化改造(ERP)
方案概述
实施步骤
整体应用容器化改造
改造流程
分析应用
准备应用运行环境
编写开机运行脚本
编写Dockerfile文件
制作并上传镜像
创建容器工作负载
容灾
在CCE中实现应用高可用部署
安全
集群安全配置
节点安全配置
容器安全配置
密钥Secret安全配置
弹性伸缩
使用HPA+CA实现工作负载和节点联动弹性伸缩
监控
Prometheus监控多个集群
集群
通过kubectl对接多个集群
网络
集群网络地址段规划实践
集群网络模型选择及各模型区别
通过负载均衡配置实现会话保持
不同场景下容器内获取客户端源IP
存储
存储扩容
挂载第三方租户的对象存储
SFS Turbo动态创建子目录并挂载
自定义StorageClass
节点跨AZ时云硬盘自动拓扑(csi-disk-topology)
容器
合理分配容器计算资源
通过特权容器功能优化内核参数
使用Init容器初始化应用
使用hostAliases配置Pod /etc/hosts
容器Core Dump
权限
通过配置kubeconfig文件实现集群权限精细化管理
发布
发布概述
使用Service实现简单的灰度发布和蓝绿发布
使用Nginx Ingress实现灰度发布和蓝绿发布
常见问题
高频常见问题
集群
集群创建
CCE集群创建失败的原因与解决方法?
集群的管理规模和控制节点的数量有关系吗?
使用CCE需要关注哪些配额限制?
集群运行
当集群状态为“不可用”时,如何排查解决?
集群删除之后相关数据能否再次找回?
集群删除
集群删除失败:弹性网卡残留
冻结或不可用的集群删除后如何清除残留资源
集群升级
CCE集群升级时,升级集群插件失败如何排查解决?
节点
节点创建
CCE集群新增节点时的问题与排查方法?
节点运行
集群可用,但节点状态为“不可用”?
如何重置CCE集群中节点的密码?
如何收集CCE集群中节点的日志?
Node节点vdb盘受损,通过重置节点仍无法恢复节点?
容器使用SCSI类型云硬盘偶现IO卡住
thinpool磁盘空间耗尽导致容器或节点异常时,如何解决?
GPU节点使用nvidia驱动启动容器排查思路
规格配置变更
如何变更CCE集群中的节点规格?
CCE节点变更规格后,为什么无法重新拉起或创建工作负载?
节点池
节点池一直在扩容中,但“操作记录”里却没有创建节点的记录?
工作负载
工作负载异常
工作负载状态异常定位方法
工作负载异常:实例调度失败
工作负载异常:实例拉取镜像失败
工作负载异常:启动容器失败
工作负载异常:实例驱逐异常(Evicted)
工作负载异常:存储卷无法挂载或挂载超时
工作负载异常:一直处于创建中
工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
工作负载异常:已停止
工作负载异常:GPU节点部署服务报错
实例网络空间更新,报sandbox相关错,如何处理?
容器设置
在什么场景下设置工作负载生命周期中的“停止前处理”?
在同一个命名空间内访问指定容器的FQDN是什么?
健康检查探针(Liveness、Readiness)偶现检查失败?
如何设置容器umask值?
Dockerfile中ENTRYPOINT指定JVM启动堆内存参数后部署容器启动报错?
CCE启动实例失败时的重试机制是怎样的?
调度策略
如何让多个Pod均匀部署到各个节点上?
如何避免节点上的某个容器被驱逐?
为什么Pod在节点不是均匀分布?
如何驱逐节点上的所有Pod?
其他
定时任务停止一段时间后,为何无法重新启动?
创建有状态负载时,实例间发现服务是指什么?
CCE容器拉取私有镜像时报错“Auth is empty”
为什么Pod调度不到某个节点上?
CCE集群中工作负载镜像的拉取策略?
下载镜像缺少层如何解决
网络管理
网络规划
集群与虚拟私有云、子网的关系是怎样的?
集群安全组规则配置
网络异常
工作负载网络异常时,如何定位排查?
为什么访问部署的应用时浏览器返回404错误码?
为什么容器无法连接互联网?
节点无法连接互联网(公网),如何排查定位?
其他
如何批量修改集群node节点安全组?
存储管理
CCE支持的存储在持久化和多节点挂载方面的区别是怎样的?
添加节点时可以不要数据盘吗?
公网访问CCE部署的服务并上传OBS,为何报错找不到host?
Pod接口ExtendPathMode: PodUID如何与社区client-go兼容?
CCE容器云存储PVC能否感知底层存储故障?
命名空间
命名空间因APIService对象访问失败无法删除
模板插件
插件安装失败,提示The release name is already exist处理
API&kubectl
用户访问集群API Server的方式有哪些?
通过API或kubectl操作CCE集群,创建的资源是否能在控制台展示?
通过kubectl连接集群时,其配置文件config如何下载?
kubectl top node命令为何报错
kubectl使用报错:Error from server (Forbidden)
域名DNS
域名解析失败,如何定位处理?
为什么CCE集群的容器无法通过DNS解析?
解析外部域名很慢或超时,如何优化配置?
如何设置容器内的DNS策略?
镜像仓库
如何上传我的镜像到CCE中使用?
权限
能否只配置命名空间权限,不配置集群管理权限?
如果不配置集群管理权限的情况下,是否可以使用API呢?
如果不配置集群管理权限,是否可以使用kubectl命令呢?
参考知识
如何扩容容器的存储空间?
如何使容器重启后所在容器IP仍保持不变?
API参考(吉隆坡区域)
使用前必读
概述
调用说明
终端节点(Endpoint)
约束与限制
基本概念
API概览
如何调用API
构造请求
认证鉴权
返回结果
API
API URL说明
集群管理
创建集群
获取指定的集群
获取指定项目下的集群
更新指定的集群
删除集群
集群休眠
集群唤醒
获取集群证书
获取任务信息
绑定、解绑集群公网apiserver地址
获取集群访问的地址
节点管理
创建节点
获取指定的节点
获取集群下所有节点
更新指定的节点
删除节点
纳管节点
重置节点
节点移除
节点迁移
节点池管理
创建节点池
获取指定的节点池
获取集群下所有节点池
更新指定节点池
删除节点池
存储管理
创建PVC(待废弃)
删除PVC(待废弃)
插件管理
创建AddonInstance
查询AddonTemplates列表
更新AddonInstance
删除AddonInstance
获取AddonInstance详情
获取AddonInstance列表
配额管理
查询CCE服务下的资源配额
API版本信息
查询API版本信息列表
使用Kubernetes API
权限和授权项
附录
状态码
错误码
获取项目ID
获取帐号ID
创建集群时指定要安装的插件
如何获取接口URI中参数
创建VPC和子网
创建密钥对
节点规格(flavor)说明
创建节点时password字段加盐加密的方法
节点可创建的最大Pod数量说明
节点操作系统
数据盘空间分配说明
节点磁盘挂载
修订记录
通用参考
云服务等级协议(SLA)
白皮书资源
支持区域
系统权限