更新时间:2024-03-29 GMT+08:00
方案概述
应用场景
该解决方案基于华为云弹性文件服务SFS Turbo,快速帮助用户在华为云上搭建SFS Turbo训练加速架构。实现快速AI训练作业,提供故障快速恢复,高速缓存,数据预热功能。适用于以下场景:AI开发,训练作业,推理服务。
方案架构
该解决方案部署架构如下图所示:
图1 方案架构图
该解决方案将会部署如下资源:
- 创建一个虚拟私有云 VPC,提供隔离、私密的虚拟网络环境。
- 创建一个AI开发平台ModelArts的计算型CPU专属实例,用于进行AI全流程开发。
- 创建一个对象存储服务 OBS桶,用于存储训练数据。
- 创建一个弹性文件服务 SFS Turbo,与OBS联动,用于给ModelArts提供共享文件存储服务。
方案优势
约束与限制
- 部署该解决方案之前,您需注册华为云账户,完成实名认证,且账号不能处于欠费或冻结状态,请根据资源和成本规划中预估价格,确保余额充足。
- 请确保在部署解决方案前,使用的华为云账号有IAM的足够权限,具体请参考3.1-创建rf_admin_trust委托。
- 确认租户配额充足:在“资源 > 我的配额”中查看以下配额是否充足,如配额不够,请提前提工单申请增加配额。