更新时间:2025-12-15 GMT+08:00
分享

准备Cluster环境

本文档中的模型运行环境是ModelArts Lite的Cluster,请参考本文档要求准备资源环境。

购买并开通资源

如果使用Cluster资源,请先阅读k8s Cluster资源购买,熟悉集群资源开通流程,再开始操作购买Cluster资源。

图1 Cluster资源开通流程

Cluster资源配置

完成集群资源购买和开通后,需要对网络、存储、容器镜像等内容进行配置,请参考k8s Cluster环境配置详细流程

图2 Lite Cluster资源配置流程图

kubectl访问集群配置

  1. 进入已创建的 CCE 集群控制版面中,根据图3的步骤进行操作,单击kubectl配置时,会弹出图4步骤页面。
    图3 配置中心
  2. 根据图4,按步骤进行:判断是否安装 kubectl、下载kubectl配置文件、在机器中安装和配置kubectl
    图4 kubectl 访问集群配置
  3. 在CCE集群节点机器中,输入命令,查看Kubernetes集群信息,若显示如图图5的内容,则配置成功。
    kubectl cluster-info
    图5 查看 Kubernetes 集群信息正确弹出内容

准备OBS存储

对象存储服务OBS是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力。标注的预处理数据和标注后的结果数据均需要存储在OBS中,因此需要准备OBS,关于创建OBS的具体流程,可参考通过控制台快速使用OBS

准备SFS Turbo存储(可选)

SFS Turbo为用户提供一个完全托管的共享文件存储。当标注流程中需要将部分流程使用GPU处理时,其处理后的数据需要使用共享存储传递给NPU,考虑到性能,建议使用SFS Turbo文件系统。关于创建SFS Turbo的具体流程,可参考创建SFS Turbo文件系统。文件系统类型推荐选用500MB/s/TiB或1000MB/s/TiB,存储容量可参考存储资源规划中SFS Turbo部分,推荐使用6.0~10.0TB以上。

图6 SFS类型和容量选择

为在Argo编排标注流程中使用SFS Turbo,需要将SFS Turbo挂载到CCE集群中,具体操作方式见通过静态存储卷使用已有极速文件存储

相关文档