文档首页/ AI开发平台ModelArts/ 服务公告/ 产品发布说明/ 昇腾云服务6.3.906版本说明

更新时间：2024-12-30 GMT+08:00

查看PDF

昇腾云服务6.3.906版本说明

本文档主要介绍昇腾云服务6.3.906版本配套的镜像地址、软件包获取方式和支持的特性能力。

配套的基础镜像

镜像地址	获取方式	配套关系镜像软件说明	配套关系
PyTorch：西南-贵阳一 swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.0.rc2-py_3.9-hce_2.0.2312-aarch64-snt9b-20240606190017-b881580	镜像发布到SWR，从SWR拉取	固件驱动：23.0.5 CANN：cann_8.0.rc2 容器镜像OS：hce_2.0 PyTorch：pytorch_2.1.0 FrameworkPTAdapter：6.0.RC2	如果用到CCE，版本要求是CCE Turbo v1.25及以上

镜像地址

获取方式

配套关系镜像软件说明

配套关系

PyTorch：

西南-贵阳一

swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.0.rc2-py_3.9-hce_2.0.2312-aarch64-snt9b-20240606190017-b881580

镜像发布到SWR，从SWR拉取

固件驱动：23.0.5

CANN：cann_8.0.rc2

容器镜像OS：hce_2.0

PyTorch：pytorch_2.1.0

FrameworkPTAdapter：6.0.RC2

如果用到CCE，版本要求是CCE Turbo v1.25及以上

软件包获取地址

软件包名称	软件包说明	获取地址
AscendCloud-6.3.906-xxx.zip	包含三方大模型训练和推理代码包：AscendCloud-LLM AIGC代码包：AscendCloud-AIGC 算子依赖包：AscendCloud-OPP	获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

软件包名称

软件包说明

获取地址

AscendCloud-6.3.906-xxx.zip

包含

三方大模型训练和推理代码包：AscendCloud-LLM
AIGC代码包：AscendCloud-AIGC
算子依赖包：AscendCloud-OPP

获取路径：Support-E

说明：

如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

支持的特性

表1 本版本支持的特性说明
分类	软件包特性说明	参考文档
三方大模型，包名：AscendCloud-LLM	支持如下模型适配PyTorch-NPU的训练。 llama2-7b llama2-13b llama2-70b qwen-7b qwen-14b qwen-72b baichuan2-13b chatglm3-6b llama3-8b llama3-70b yi-6B yi-34B qwen1.5-7B qwen1.5-14B qwen1.5-32B qwen1.5-72B qwen2-0.5b qwen2-1.5b qwen2-7b qwen2-72b glm4-9b	LLM开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） LLM开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
三方大模型，包名：AscendCloud-LLM	支持如下模型适配PyTorch-NPU的推理。 llama-7B llama-13b llama-65b llama2-7b llama2-13b llama2-70b llama3-8b llama3-70b yi-6b yi-9b yi-34b deepseek-llm-7b deepseek-coder-instruct-33b deepseek-llm-67b qwen-7b qwen-14b qwen-72b qwen1.5-0.5b qwen1.5-7b qwen1.5-1.8b qwen1.5-14b qwen1.5-32b qwen1.5-72b qwen1.5-110b qwen2-0.5b qwen2-1.5b qwen2-7b qwen2-72b baichuan2-7b baichuan2-13b chatglm2-6b chatglm3-6b glm-4-9b gemma-2b gemma-7b mistral-7b mixtral 8*7B ascend-vllm支持如下推理特性： vllm版本升级至0.4.2 llama、qwen系列模型支持w8a8、w4a16量化支持prefix caching、投机推理特性	LLM开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） LLM开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
AIGC，包名：AscendCloud-AIGC	支持如下框架或模型基于DevServer的PyTorch NPU推理： ComfyUI LLaVA Qwen-VL Wav2Lip 支持如下模型基于DevServer的PyTorch NPU的训练： Qwen-VL LLaVA	SDXL&SD1.5 ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.906） LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） Qwen-VL基于DevServer适配PyTorch NPU的推理指导(6.3.906) Wav2Lip基于DevServer适配PyTorch NPU推理指导 LLaVA模型基于DevServer适配PyTorch NPU训练指导（6.3.906） Qwen-VL基于DevServer适配PyTorch NPU训练指导(6.3.906)
算子，包名：AscendCloud-OPP	Scatter、Gather算子性能提升，满足MoE训练场景 matmul、swiglu、rope等算子性能提升，支持vllm推理场景新增random随机数算子，优化FFN算子，满足AIGC等场景新增自定义交叉熵融合算子，满足BMTrain框架训练性能要求优化PageAttention算子，满足vllm投机推理场景新增CopyBlocks算子，满足vllm框架beam search解码场景	无

父主题： 产品发布说明

上一篇：昇腾云服务6.3.907版本说明

下一篇：昇腾云服务6.3.905版本说明

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

昇腾云服务6.3.906版本说明

配套的基础镜像

软件包获取地址

支持的特性

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线