文档首页/
AI开发平台ModelArts/
最佳实践/
LLM大语言模型推理/
LLM大语言模型推理历史版本文档/
主流开源大模型基于Lite Server&Cluster适配Ascend-vLLM PyTorch NPU推理指导(6.5.905)/
Server部署推理服务/
部署准备
更新时间:2025-07-29 GMT+08:00
部署准备
步骤一:检查环境
步骤一:检查环境,检查NPU设备、容器内的网络访问等情况。
步骤二:获取基础镜像
建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表 基础容器镜像地址。
docker pull {image_url}
父主题: Server部署推理服务