文档首页/ AI开发平台ModelArts/ 最佳实践/ DeepSeek&Qwen3基于Lite Server&Cluster推理/ DeepSeek&Qwen3模型基于Lite Cluster适配NPU的混部推理解决方案/ 准备、安装部署依赖/ 获取推理镜像

更新时间：2025-10-14 GMT+08:00

查看PDF

获取推理镜像

根据表2获取相应资源的推理基础镜像。
根据获取昇腾云版本包获取相应资源的推理软件包。

用于开源三方大模型推理的参考制作推理镜像来构建生产镜像。

用于DeepSeek推理的在安装有docker的环境中执行下述命令制作镜像，请确保机器环境可以访问公网：

unzip AscendCloud-*.zip -d ./AscendCloud && cd ./AscendCloud && unzip AscendCloud-OPP-*.zip && unzip AscendCloud-OPP-*-torch-*-py*.zip -d ./AscendCloud-OPP && cd .. && unzip ./AscendCloud/AscendCloud-LLM-*.zip -d ./AscendCloud/AscendCloud-LLM && cd ./AscendCloud/AscendCloud-LLM/llm_inference/ascend_vllm/ && sh build_image.sh --base-image=${base_image} --image-name=${image_name}

参数说明：

${base_image}为基础镜像地址。
${image_name}为推理镜像名称，可自行指定。

父主题： 准备、安装部署依赖

上一篇：准备W8A8权重

下一篇：检查环境

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问