存储挂载
场景描述
在 ModelArts 推理部署场景中,文件存储挂载是解决大模型存储、数据共享、加载加速的核心能力,适配高性能、高稳定、高吞吐的推理业务需求,核心适用场景如下:
- 超大模型存储与加载:大语言模型、多模态模型等体积可达数十 GB 至 TB 级,无法通过容器镜像内置模型,需借助挂载存储统一存储模型文件,供推理实例直接读取,避免镜像臃肿与部署超时。
- 多实例数据共享:同一推理服务的多个副本、不同推理服务间,需共享配置文件、推理依赖数据、中间结果等,挂载存储可实现数据统一管理、实时同步,无需重复拷贝。
- 推理加速与快速恢复:通过本地存储加速功能,将模型缓存至宿主机,容器故障重启时复用缓存,省去重复拉取模型的耗时,大幅提升服务恢复效率,适配高可用业务场景。
- 预热模型快速复用:资源池提前预热高频使用模型,部署推理服务时直接挂载已预热模型,无需重复加载,缩短部署时间,适配高频、快速上线的推理需求。
- 自定义模型部署:非 ModelArts 平台内置的自定义模型,可通过挂载方式接入推理服务,灵活适配第三方模型、自研模型的部署场景。
支持的存储类型
ModelArts在线推理服务支持在模型来源中配置存储类型、也支持单元配置时挂载存储。
- 模型来源存储类型
部署页面模型配置里选择的存储,专门用来存放推理运行依赖的模型权重文件,目的是加载AI模型,属于服务启动必备,大部分场景只读取不修改。配置操作入口参见部署在线服务-部署配置。
图1 模型来源-存储类型
模型来源支持的存储类型包括:对象存储OBS-对象桶、对象存储OBS-并行文件系统、高性能弹性文件存储SFS Turbo、资源池已预热模型存储类型。表1 模型来源存储类型-选型推荐 存储类型
适用场景
限制说明
对象存储OBS-对象桶
- 中小型轻量模型(几十 MB~ 几 GB)
- 测试环境、演示场景、非核心线上业务
- 模型更新频率低、并发量小、访问压力小
- 追求最低存储成本,不在意加载速度
- 仅做简单推理,无海量小文件读取
大模型或超大模型、高并发推理、批量快速拉起服务场景不适用
对象存储OBS-并行文件系统
- 主流大模型部署首选(7B、13B、34B 等通用大模型)
- 多实例高并发推理、集群化在线推理
- 模型文件多、分层目录多、海量小文件模型
- 训练 + 推理数据互通,频繁读写模型附属文件
- 想要高性能 + 低成本平衡,不想用高价 SFS Turbo
- 企业正式线上推理业务
/
高性能弹性文件存储SFS Turbo
- 千亿级超大参数模型正式生产上线
- 金融、政务等高稳定、低时延、强一致性核心业务
- 要求模型秒级加载、服务极速重启恢复
- 推理过程中需要实时修改模型配置、动态读写权重
- 对 IO 时延、稳定性、故障恢复速度要求极高
- 使用成本偏高
- 只能在专属资源池使用,并且专属资源池需要关联SFS Turbo
资源池已预热模型存储类型
- 快速测试、临时上线、紧急扩容
- 通用标准化模型反复频繁部署
- 追求最快启动速度,不想等待模型下载加载
- 同一专属资源池内大批量批量部署推理服务
- 只能在专属资源池使用
- 必须提前把模型预热到节点
- 只能调度到已预热节点,调度失败无法启动
- 单元配置中的文件挂载存储
推理单元里额外新增的挂载存储,不存放主模型,只挂载业务运行配套数据、输入输出文件、推理产物转储等。作用是支撑模型跑完业务流程,属于业务配套资源,非强制必选,大多为读写模式。配置操作入口参见部署在线服务-部署配置。
图2 单元配置-文件存储挂载
单元配置中文件存储支持的存储类型包括:对象存储OBS-对象桶、对象存储OBS-并行文件系统、高性能弹性文件存储SFS Turbo、资源池已预热模型存储类型。
单元配置中产物转储支持的存储类型包括:对象存储OBS-并行文件系统。
对象存储OBS-对象桶
- “存储地址”:选择OBS桶的路径,不支持选择跨区域(Region)的OBS桶。最多支持添加15条挂载记录。如果您的OBS桶中有需要特别保护的敏感数据,请自行对数据加密后再放到OBS桶。
建议新建一个目录挂载OBS桶,避免选择严格权限的存量目录以及系统目录。
用户自己的OBS桶可以在界面选择,也可以手动输入路径,路径格式以“obs://”开头并以“/”结尾,例如“obs://bucketname/path/”。其他人的共享桶路径仅支持手动输入地址。
当ModelArts对接IAM场景下,使用其他人的共享桶路径时,需要共享桶拥有者在桶ACL策略中给使用者的账号授权,授予桶访问权限和对象权限的读权限,如图3所示。
同时共享桶拥有者的账号需要在ModelArts平台设置包含OBS权限的所有用户委托(授权对象类型选择所有用户,功能权限勾选对象存储服务OBS),具体操作详见快速配置ModelArts委托授权。
- “挂载路径”:指定容器内部的挂载路径,如“/obs-mount/”。建议新建一个目录挂载OBS桶,避免选择严格权限的存量目录以及系统目录。当存在多个挂载路径时请避免使用父子级目录。
- “本地存储加速”:从外部存储拉取模型数据到宿主机(通常为CCE集群节点),挂载宿主机上的模型路径到用户指定的容器目录,当业务容器因为故障等原因重启后,如果本地缓存还在当前节点,可以省去模型拉取过程。通过本地存储加速,当业务容器因故障重启时,可直接复用本地缓存,从而实现快速恢复。本地缓存保留的前提是业务容器所在的节点未被销毁且存储卷未被删除。若节点发生故障或存储卷被清理,缓存将失效,需重新拉取模型数据。
如果使用本地存储加速功能,需要保证专属资源池的数据盘容量在1024GiB以上。
对象存储OBS-并行文件系统
- “存储地址”:选择并行文件的存储路径。不支持选择跨区域(Region)的OBS并行文件系统。如果您的OBS并行文件系统中有需要特别保护的敏感数据,请自行对数据加密后再存放到OBS并行文件系统。
用户自己的OBS并行文件系统可以在界面选择,也可以手动输入路径,路径格式以“obs://”开头并以“/”结尾,例如“obs://bucketname/path/”。其他人的共享OBS路径仅支持手动输入地址。
当ModelArts对接IAM场景下,使用其他人的共享OBS路径时,需要OBS拥有者在ACL策略中给使用者的账号授权,授予OBS访问权限和对象权限的读权限,如图4所示。
同时共享桶拥有者的账号需要在ModelArts平台设置包含OBS权限的所有用户委托(授权对象类型选择所有用户,功能权限勾选对象存储服务OBS),具体操作详见快速配置ModelArts委托授权。
- “挂载路径”:指定容器内部的挂载路径,如“/obs-mount/”。
- 请选择全新目录,选择存量目录会覆盖存量文件,OBS挂载仅开放对挂载目录文件新增、查看、修改功能不支持删除挂载目录文件对象,如果需要删除文件请到OBS并行文件系统中手动删除。
- 建议挂载在空目录下,如果目录不为空,请确保目录下无影响容器启动的文件,否则文件会被替换,导致容器启动异常,工作负载创建失败。
- 挂载路径必须以/开头,仅允许输入英文、数字和特殊字符\_-且不超过1024个字符。
- “本地存储加速”:从外部存储拉取模型数据到宿主机(通常为CCE集群节点),挂载宿主机上的模型路径到用户指定的容器目录,当业务容器因为故障等原因重启后,如果本地缓存还在当前节点,可以省去模型拉取过程。通过本地存储加速,当业务容器因故障重启时,可直接复用本地缓存,从而实现快速恢复。本地缓存保留的前提是业务容器所在的节点未被销毁且存储卷未被删除。若节点发生故障或存储卷被清理,缓存将失效,需重新拉取模型数据。
如果使用本地存储加速功能,需要保证专属资源池的数据盘容量在1024GiB以上。
高性能弹性文件存储SFS Turbo
使用专属资源池部署服务才允许使用存储挂载的能力,并且专属资源池需要关联SFS Turbo,具体操作请参见关联专属资源池的网络至SFS Turbo。
参数说明如下:
- “文件系统/文件系统目录”:选择对应的SFS Turbo极速文件。不支持选择跨区域(Region)的极速文件系统。
- “挂载路径”:指定容器内部的挂载路径,如“/sfs-turbo-mount/”。请选择全新目录,选择存量目录会覆盖存量文件。当存在多个挂载路径时请避免使用父子级目录。
- “挂载方式”:支持“读写”和“只读”两种方式。
- “本地存储加速”:从外部存储拉取模型数据到宿主机(通常为CCE集群节点),挂载宿主机上的模型路径到用户指定的容器目录,当业务容器因为故障等原因重启后,如果本地缓存还在当前节点,可以省去模型拉取过程。通过本地存储加速,当业务容器因故障重启时,可直接复用本地缓存,从而实现快速恢复。本地缓存保留的前提是业务容器所在的节点未被销毁且存储卷未被删除。若节点发生故障或存储卷被清理,缓存将失效,需重新拉取模型数据。
注意事项如下:
- 相同的文件系统只能挂载一次 ,且只能对应一个挂载路径,挂载路径均不可重复。最多可以挂载8个盘。
- 选择多挂载时请勿设置存在冲突的挂载路径如相同路径或相似路径如/obs-mount/与/obs-mount/tmp/等。
- 选择SFS Turbo存储挂载后,请勿解除SFS Turbo关联,否则会导致挂载功能无法使用。挂载时默认按客户端umask权限设置,为确保正常使用须在SFS Turbo界面绑定后端OBS存储后设置权限为777。
资源池已预热模型
- “已预热模型”:选择已在ModelArts资源池预热的模型。
- “挂载路径”:指定挂载路径。挂载路径即容器内挂载路径,建议新建目录,避免选择严格权限的存量目录以及系统目录。挂载路径必须以/开头和结尾,整个挂载路径长度不能超过255位。挂载路径与其他模型来源的挂载路径本质上要求是一样的。
由于资源限制,若调度到未预热的节点,会导致部署失败。

