昇腾云服务6.3.T061版本说明
本文档主要介绍昇腾云服务6.3.T061版本配套的镜像地址、软件包获取方式和支持的特性能力。
配套的基础镜像
镜像地址 |
新增主要特性 |
获取方式 |
配套关系 |
---|---|---|---|
PyTorch: 西南-贵阳一 swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.0.rc2-py_3.9-hce_2.0.2312-aarch64-snt9b-20240606190017-b881580 |
|
镜像发布到SWR,从SWR拉取 |
cann_8.0.rc2 pytorch_2.1.0 hce_2.0 MindSpore 2.3.0 FrameworkPTAdapter6.0.RC2 |
软件包获取地址
软件包名称 |
软件包说明 |
获取地址 |
---|---|---|
AscendCloud-6.3.906-xxx.zip |
包含 1. 三方大模型训练和推理代码包 2. 算子依赖包 |
获取路径:Support-E
说明:
如果没有下载权限,请联系您所在企业的华为方技术支持下载获取。 |
支持的特性
分类 |
软件包特性说明 |
参考文档 |
---|---|---|
三方大模型,包名:AscendCloud-3rdLLM |
支持如下模型适配PyTorch-NPU的训练。
|
无 |
支持如下模型适配PyTorch-NPU的推理。
支持如下推理特性: 1. llama 系列推理支持bf16数据类型 2. llama 系列推理支持w8a8、w4a16量化 3. 支持MoE-mixtral 8*7B 推理 4. vllm推理框架支持prefix caching |
无 |
|
算子,包名:AscendCloud-OPP |
提供配套的推理量化算子 |
无 |