昇腾云服务6.3.T051版本说明
昇腾云服务6.3.T051版本发布支持的软件包和能力说明如下,软件包获取路径:Support网站。
此版本仅支持部分客户的beam-search、AWQ量化和SmoothQuant量化特性使用。
发布包 |
软件包特性说明 |
配套说明 |
备注 |
---|---|---|---|
昇腾云模型代码 |
包名:AscendCloud-3rdLLM 三方大模型,包名:AscendCloud-3rdLLM PyTorch框架下支持如下模型训练:
PyTorch框架下支持如下模型推理:
|
配套CANN8.0.RC2镜像(非商发) 其中Llama/Llama2/Llama3系列、Qwen系列、Qwen1.5系列推理支持AWQ(W4A16), SmoothQuant(W8A8)量化 所有推理请求均支持beam-search短期方案。 |
无 |
算子,包名:AscendCloud-OPP 配套W4A16和W8A8的算子 |
配套CANN8.0.RC2镜像(非商发) |
无 |
|
基础镜像 |
PyTorch: 西南-贵阳一 swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2.1.0-cann_8.0.rc2-py_3.9-hce_2.0.2312-aarch64-snt9b-20240518201626-e439695 |
镜像发布到SWR(非商发) |
无 |