文档首页/
AI开发平台ModelArts/
最佳实践/
DeepSeek&Qwen3基于Lite Server&Cluster推理/
DeepSeek&Qwen3模型基于ModelArts Lite Cluster适配NPU的混部推理解决方案/
准备、安装部署依赖/
获取DeepSeek权重/
准备FP8权重
更新时间:2025-10-14 GMT+08:00
准备FP8权重
约束限制
由于模型权重较大,请确保您的磁盘有足够的空间放下所有权重,例如DeepSeekV3权重约为630G左右。
下载DeepSeek官方发布的FP8权重
下载FP8的权重地址如下:
父主题: 获取DeepSeek权重