华为云UCS
华为云UCS
- 最新动态
- 服务公告
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- UCS集群
- 容器舰队
- 集群联邦
- 镜像仓库
- 权限管理
-
策略中心
- 策略中心概述
- 策略定义与策略实例的基本概念
- 启用策略中心
- 创建和管理策略实例
- 示例:使用策略中心实现Kubernetes资源合规性治理
-
使用策略定义库
- 策略定义库概述
- k8spspvolumetypes
- k8spspallowedusers
- k8spspselinuxv2
- k8spspseccomp
- k8spspreadonlyrootfilesystem
- k8spspprocmount
- k8spspprivilegedcontainer
- k8spsphostnetworkingports
- k8spsphostnamespace
- k8spsphostfilesystem
- k8spspfsgroup
- k8spspforbiddensysctls
- k8spspflexvolumes
- k8spspcapabilities
- k8spspapparmor
- k8spspallowprivilegeescalationcontainer
- k8srequiredprobes
- k8srequiredlabels
- k8srequiredannotations
- k8sreplicalimits
- noupdateserviceaccount
- k8simagedigests
- k8sexternalips
- k8sdisallowedtags
- k8sdisallowanonymous
- k8srequiredresources
- k8scontainerratios
- k8scontainerrequests
- k8scontainerlimits
- k8sblockwildcardingress
- k8sblocknodeport
- k8sblockloadbalancer
- k8sblockendpointeditdefaultrole
- k8spspautomountserviceaccounttokenpod
- k8sallowedrepos
- 配置管理
- 服务网格
- 流量分发
- 可观测性
- 云原生服务中心
- 容器迁移
- 流水线
- 错误码
- 最佳实践
- API参考
- 常见问题
- 文档下载
- 通用参考
本文导读
链接复制成功!
创建NPU应用
前提条件
- 如果您需要通过命令行创建,需要使用kubectl连接到集群,详情请参见通过kubectl连接集群。
约束与限制
- 当前不支持npu负载多容器能力。
通过控制台创建NPU应用
本节以创建无状态工作负载(Deployment)为例,说明通过控制台创建npu资源应用的方法。
- 登录UCS控制台,选择容器舰队,单击集群名称进入集群。
- 左侧导航栏中选择“工作负载 > 无状态负载”,右上角单击“镜像创建”。
- 配置工作负载信息。在“容器配置>基本信息”中,异构资源选择“NPU”,并设置NPU配额。
- 配置其余信息,完成后,单击“创建工作负载”。返回无状态工作负载列表查看工作负载状态。
在工作负载列表中,待工作负载状态为“运行中”,工作负载创建成功。
通过kubectl命令行创建NPU应用
本节以创建无状态工作负载(Deployment)为例,说明使用kubectl命令创建训练任务的方法。
apiVersion: apps/v1
kind: Deployment
metadata:
annotations:
description: ''
labels:
appgroup: ''
version: v1
name: demo
namespace: default
spec:
selector:
matchLabels:
app: demo
version: v1
template:
metadata:
labels:
app: demo
version: v1
spec:
containers:
- name: container-1
image: <your_image_address> # 请替换为您的镜像地址
imagePullPolicy: IfNotPresent
env:
- name: PAAS_APP_NAME
value: demo
- name: PAAS_NAMESPACE
value: default
- name: PAAS_PROJECT_ID
value: 0aa612a71f80d4322fe0c010beb80e8a
resources:
requests:
cpu: 250m
memory: 512Mi
huawei.com/ascend-1980: '1' ##需要使用的npu卡数量
limits:
cpu: 250m
memory: 512Mi
huawei.com/ascend-1980: '1' ##需要使用的npu卡数量
terminationGracePeriodSeconds: 30
schedulerName: volcano ## 使用的调度器指定为volcano
tolerations:
- key: node.kubernetes.io/not-ready
operator: Exists
effect: NoExecute
tolerationSeconds: 300
- key: node.kubernetes.io/unreachable
operator: Exists
effect: NoExecute
tolerationSeconds: 300
initContainers: []
volumes: []
replicas: 2
revisionHistoryLimit: 10
strategy:
type: RollingUpdate
rollingUpdate:
maxUnavailable: 25%
maxSurge: 25%
progressDeadlineSeconds: 600
父主题: NPU调度