云容器实例 CCI云容器实例 CCI

计算
弹性云服务器 ECS
裸金属服务器 BMS
云手机 CPH
专属主机 DeH
弹性伸缩 AS
镜像服务 IMS
函数工作流 FunctionGraph
云耀云服务器 HECS
VR云渲游平台 CVR
特惠算力专区
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
弹性文件服务 SFS
存储容灾服务 SDRS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
专属企业存储服务
云存储网关 CSG
专属分布式存储服务 DSS
CDN与智能边缘
内容分发网络 CDN
智能边缘云 IEC
智能边缘小站 IES
智能边缘平台 IEF
人工智能
AI开发平台ModelArts
华为HiLens
图引擎服务 GES
图像识别 Image
文字识别 OCR
自然语言处理 NLP
内容审核 Moderation
图像搜索 ImageSearch
医疗智能体 EIHealth
园区智能体 CampusGo
企业级AI应用开发专业套件 ModelArts Pro
人脸识别服务 FRS
对话机器人服务 CBS
视频分析服务 VAS
语音交互服务 SIS
知识图谱 KG
人证核身服务 IVS
IoT物联网
设备接入 IoTDA
设备管理 IoTDM(联通用户专用)
全球SIM联接 GSL
IoT开发者服务
IoT数据分析
车联网服务 IoV
路网数字化服务 DRIS
IoT边缘 IoTEdge
设备发放 IoTDP
开发与运维
软件开发平台 DevCloud
项目管理 ProjectMan
代码托管 CodeHub
流水线 CloudPipeline
代码检查 CodeCheck
编译构建 CloudBuild
部署 CloudDeploy
云测 CloudTest
发布 CloudRelease
移动应用测试 MobileAPPTest
CloudIDE
Classroom
开源镜像站 Mirrors
应用魔方 AppCube
云性能测试服务 CPTS
应用管理与运维平台 ServiceStage
云应用引擎 CAE
视频
实时音视频 SparkRTC
视频直播 Live
视频点播 VOD
媒体处理 MPC
视频接入服务 VIS
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
资源管理服务 RMS
应用身份管理服务 OneAccess
区块链
区块链服务 BCS
可信跨链服务 TCS
智能协作
IdeaHub
开发者工具
SDK开发指南
API签名指南
DevStar
HCloud CLI
Terraform
Ansible
API问题定位指导
云生态
云市场
合作伙伴中心
华为云培训中心
其他
管理控制台
消息中心
产品价格详情
系统权限
我的凭证
客户关联华为云合作伙伴须知
公共问题
宽限期保留期
奖励推广计划
活动
容器
云容器引擎 CCE
云容器实例 CCI
容器镜像服务 SWR
应用编排服务 AOS
多云容器平台 MCP
基因容器 GCS
容器洞察引擎 CIE
云原生服务中心 OSC
容器批量计算 BCE
容器交付流水线 ContainerOps
应用服务网格 ASM
网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
数据库
云数据库 RDS
数据复制服务 DRS
文档数据库服务 DDS
分布式数据库中间件 DDM
云数据库 GaussDB (for openGauss)
云数据库 GaussDB(for MySQL)
云数据库 GaussDB NoSQL
数据管理服务 DAS
数据库和应用迁移 UGO
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
可信智能计算服务 TICS
推荐系统 RES
云搜索服务 CSS
数据可视化 DLV
数据湖治理中心 DGC
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
API网关 APIG
分布式缓存服务 DCS
分布式消息服务RocketMQ版
企业应用
域名注册服务 Domains
云解析服务 DNS
云速建站 CloudSite
网站备案
华为云WeLink
会议
隐私保护通话 PrivateNumber
语音通话 VoiceCall
消息&短信 MSGSMS
云管理网络
SD-WAN 云服务
边缘数据中心管理 EDCM
云桌面 Workspace
应用与数据集成平台 ROMA Connect
ROMA资产中心 ROMAExchange
API全生命周期管理 ROMA API
安全与合规
安全技术与应用
DDoS防护 ADS
Web应用防火墙 WAF
云防火墙 CFW
应用信任中心 ATC
企业主机安全 HSS
容器安全服务 CGS
云堡垒机 CBH
数据库安全服务 DBSS
数据加密服务 DEW
数据安全中心 DSC
云证书管理服务 CCM
SSL证书管理 SCM
漏洞扫描服务 VSS
态势感知 SA
威胁检测服务 MTD
管理检测与响应 MDR
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
专属云
专属计算集群 DCC
解决方案
高性能计算 HPC
SAP
游戏云
混合云灾备
华为工业云平台 IMC
价格
成本优化最佳实践
专属云商业逻辑
用户服务
帐号中心
费用中心
成本中心
资源中心
企业管理
工单管理
客户运营能力
国际站常见问题
支持计划
专业服务
合作伙伴支持计划
文档首页> 云容器实例 CCI> 用户指南> 工作负载> 无状态负载(Deployment)
更新时间:2021-07-27 GMT+08:00
分享

无状态负载(Deployment)

无状态负载与Kubernetes中Deployment Workloads的定义方式相同,是对Pod的服务化封装。一个无状态负载可以包含一个或多个Pod,每个Pod的角色相同,所以系统会自动为无状态负载的多个Pod分发请求。同一无状态负载的所有Pod共享存储卷。

Pod这个章节介绍了Pod,Pod是Kubernetes创建或部署的最小单位,但是Pod是被设计为相对短暂的一次性实体,Pod可以被驱逐(当节点资源不足时)、随着集群的节点fail而消失。同时kubernetes提供了Controller(控制器)来管理Pod,Controller可以创建和管理多个Pod,提供副本管理、滚动升级和自愈能力,其中最为常用的就是Deployment。

一个Deployment可以包含一个或多个Pod副本,每个Pod副本的角色相同,所以系统会自动为Deployment的多个Pod副本分发请求。

Deployment集成了上线部署、滚动升级、创建副本,恢复上线任务,在某种程度上,Deployment可以帮我们实现无人值守的上线,大大降低我们的上线过程的复杂沟通、操作风险。

图1 无状态负载

创建无状态负载

  1. 登录云容器实例管理控制台,左侧导航栏中选择工作负载 > 无状态(Deployment),在右侧页面单击“创建无状态负载”
  2. 添加基本信息。

    • 负载名称

      请输入以小写字母或数字开头,小写字母、数字、中划线(-)、点(.)组成(其中两点不能相连,点不能与中划线相连),小写字母或数字结尾的1到63字符的字符串。负载名称不支持修改,如需修改名称,需要重新创建。

    • 命名空间

      选择命名空间,如果还未创建命名空间,请参考命名空间创建。

    • 负载描述

      描述信息,少于等于250个字符。

    • Pod数量

      负载可以有一个或多个Pod,您可以设置具体Pod个数。每个负载Pod都由相同的容器部署而成。设置多个Pod主要用于实现高可靠性,当某个Pod故障时,负载还能正常运行。

    • Pod规格

      您可以选择使用GPU(只能在GPU型命名空间下)或不使用GPU。

      当前提供3种类型的Pod,包括通用计算型(通用计算型命名空间下使用)、RDMA加速型和GPU加速型(GPU型命名空间下使用)。

      GPU加速型Pod提供NVIDIA Tesla V100 32G显卡和NVIDIA Tesla V100 16G显卡,具体的规格有如下所示。
      • NVIDIA Tesla V100 32G显卡:
        • NVIDIA Tesla V100 32G x 1,CPU 4核,内存32GB
        • NVIDIA Tesla V100 32G x 2,CPU 8核,内存64GB
        • NVIDIA Tesla V100 32G x 4,CPU 16核,内存128GB
        • NVIDIA Tesla V100 32G x 8,CPU 32核,内存256GB
      • NVIDIA Tesla V100 16G显卡:
        • NVIDIA Tesla V100 16G x 1,CPU 4核,内存32GB
        • NVIDIA Tesla V100 16G x 2,CPU 8核,内存64GB
        • NVIDIA Tesla V100 16G x 4,CPU 16核,内存128GB
        • NVIDIA Tesla V100 16G x 8,CPU 32核,内存256GB
      云容器实例支持使用NVIDIA GPU的驱动版本为410.104418.126,您应用程序中使用的CUDA需满足如表1所示的配套关系。CUDA与驱动的配套关系来源于NVIDIA官网,详细信息请参见CUDA Compatibility
      表1 NVIDIA GPU驱动与CUDA配套关系

      NVIDIA GPU驱动版本

      CUDA Toolkit版本

      410.104

      CUDA 10.0 (10.0.130)及以下

      418.126

      CUDA 10.1 (10.1.105)及以下

      当不使用GPU时,Pod规格需满足如下要求:
      • Pod的CPU取值范围为0.25核-32核,或者自定义选择48核64核,且单个容器的CPU必须为0.25核的整数倍
      • Pod的内存取值范围为1GB-512GB,且内存必须为1GB的整数倍
      • Pod的CPU/内存配比值必须在1:2到1:8之间
      • 一个Pod内最多支持5个容器,单个容器最小配置是0.25核、0.2GB,最大同容器实例的最大配置
      • Pod中所有容器和InitContainer(启动容器)规格中的request和limit相等
    • 容器配置
      一个Pod可以包含一个或多个运行不同镜像的容器,通常情况下一个Pod中只有一个容器,若您的应用程序需要多个容器,请单击“添加容器”,然后选择镜像。

      同一个Pod实例中的不同容器如果监听了相同的端口,则会导致端口冲突,Pod可能会启动失败。例如在Pod中添加了一个nginx镜像容器,启动了80端口,如果该Pod中另一个http服务的镜像也启动80端口,那么这个Pod就会出现端口冲突。

      • 我的镜像:展示了您上传到容器镜像服务的镜像。
        • 如您是IAM用户,您需要参考(可选)上传镜像进行权限设置后才可使用帐号的私有镜像。
        • CCI当前暂不支持对接第三方镜像仓库。
        • 镜像单层解压后的实际大小不能超过20G。
        • 鲲鹏容器只支持arm的镜像架构类型,普通容器只支持x86的镜像架构类型。
      • 开源镜像中心:展示了镜像中心的公共镜像。
      • 共享镜像:展示了容器镜像服务中他人共享的镜像。

      镜像选择完成后,需要选择镜像的版本、设置容器名称、设置容器占用的CPU和内存规格(单个容器最小配置是0.25核、0.2GB),并选择是否开启采集标准输出文件(开启后,应用运维管理AOM将根据实际使用量进行计费)。

      每个租户一个月有500M的免费日志存储空间,超过500M时AOM将根据实际使用量进行收费,计费规则请参见产品价格详情

      对于GPU加速型Pod(仅GPU型命名空间下才可以选择),Pod中只有一个容器能使用GPU,如果您的Pod中有多个容器,您可以通过开启GPU这个开关选择哪个容器使用GPU。

      您还可以为容器做如下高级设置:

      • 存储:支持挂载持久化卷到容器中,以实现数据文件的持久化存储,当前支持云硬盘存储卷、文件存储卷和极速文件存储卷。单击“添加云硬盘存储卷”“添加文件存储卷”“添加极速文件存储卷”,输入名称、容量、容器内挂载路径,选择磁盘类型。负载创建完成后,可对存储卷进行管理,具体请参见云硬盘存储卷文件存储卷极速文件存储卷
      • 日志采集:支持根据您配置的日志输出路径,采集应用日志请自行防爆处理。单击添加日志存储,输入容器内日志路径,调整日志存储空间。负载创建完成后,可在AOM界面查看日志,具体请参见日志管理
      • 环境变量:在容器中设置环境变量,支持手动输入和引用变量。环境变量为应用提供极大的灵活性,您可以在应用程序中使用环境变量,在创建容器时为环境变量赋值,容器运行时读取环境变量的值,从而做到灵活的配置,而不是每次都重新编写应用程序制作镜像。

        手动输入只需要直接输入变量名称和变量值。

        变量引用支持引用PodIP(Pod的IP地址)、PodName(Pod的名称)以及Secret,输入变量名称,选择引用类型、引用值。其中Secret引用的创建请参见使用Secret

      • 健康检查:健康检查是指容器运行过程中,根据您需要,定时检查容器健康状况。详细步骤请参见健康检查
      • 生命周期:生命周期脚本定义,在容器的生命周期的特定阶段执行调用。详细步骤请参见容器生命周期
      • 启动命令:输入容器启动命令,容器启动后会立即执行。启动命令对应于容器引擎的ENTRYPOINT启动命令,详细内容请参见容器启动命令
      • 配置管理:容器支持挂载ConfigMap和Secret。ConfigMap和Secret的创建请参见使用ConfigMap使用Secret

  3. 单击“下一步:访问配置”,配置负载访问信息。

    负载访问有如下三个选项:

    • 不启用:将不提供任何从其他负载访问到当前负载的入口,可用于使用自定义的服务发现或简单启用多个Pod的场景。
    • 内网访问:内网访问将为当前负载配置一个负载域名或内网域名/虚拟IP,使得当前负载能够为内网中其他负载提供服务,分为Service和ELB两种方式。内网访问的详细内容请参见内网访问
    • 公网访问:将提供一个可以从Internet访问的入口,支持HTTP/HTTPS/TCP/UDP协议。公网访问的详细内容请参见公网访问

  4. 单击“下一步:高级设置”,进行高级设置。

    • 升级策略:升级方式支持“滚动升级”“替换升级”
      • 滚动升级:滚动升级将逐步用新版本的实例替换旧版本的实例,升级的过程中,业务流量会同时负载均衡分布到新老的实例上,因此业务不会中断。

        最大无效实例数:每次滚动升级允许的最大无效实例数,如果等于实例数有断服风险(最小存活实例数 = 实例数 - 最大无效实例数)。

      • 替换升级:先删除旧实例,再创建新实例。升级过程中业务会中断。
    • 性能管理配置:华为云的性能管理服务(APM)可协助您快速进行工作负载的问题定位与性能瓶颈分析。
      当前仅支持给Java类工作负载提供调用链、拓扑等监控能力,若您为Java类工作负载,并且需要监控状态,请勾选“Java探针”选项,并输入监控组名称。

      安装探针会产生少量资源消耗,主要作用是可对java工作负载提供应用调用链、拓扑、SQL分析、堆栈追踪等监控能力。

      1. 输入监控组名称,如testapp。若已有监控组,可下拉选择。
      2. 选择“探针版本”,探针版本默认为latest,具体可查看下拉框后的“版本说明”
        图2 设置性能管理配置
      3. 选择“探针升级策略”,默认为“重启自动升级”

        “探针升级策略”为获取探针镜像的策略,可选值有“重启自动升级”“手动升级”

        • 重启自动升级:每次都尝试重新下载镜像。
        • 手动升级:如果本地有该镜像,则使用本地镜像,本地不存在时下载镜像。

  5. 配置完成后,单击“下一步:规格确认”,单击“提交”,单击“返回无状态负载列表”。

    在负载列表中,待负载状态为“运行中”,负载创建成功。您可以单击负载名进入负载详情界面,按F5查看负载实时状态。

    若需要访问负载,选择“访问配置”Tab页,查看访问地址。

删除Pod

负载创建完后,可以对Pod进行手动删除操作,由于Pod是有控制器在控制,单击删除按钮后会立即重新创建一个新的Pod。手动删除Pod在某些场景下非常有用,比如升级到一半出现失败时、想重启业务进程时。

删除Pod如图3所示。

图3 删除Pod

删除后立即重新创建Pod,如图4所示。

图4 删除Pod的效果

使用kubectl创建无状态负载

使用kubectl创建无状态负载请参见Deployment

重新拉取镜像失败问题排查

工作负载详情中,若事件中提示“重新拉取镜像失败”,请参见事件一:重新拉取镜像失败来排查原因。

重新启动容器失败问题排查

工作负载详情中,若事件中提示“重新启动容器失败”,请参见事件二:重新启动容器失败来排查原因。

分享:

    相关文档

    相关产品

关闭导读