检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
950808 转 1
预约咨询
工单提交
我有建议
未实名认证
已实名认证
分享文档到微博
复制链接到剪贴板
链接复制成功!
该解决方案主要部署的模型列表
序号
模型名称
是否支持fp16/bf16推理
是否支持W8A8量化
v0/v1 后端
最小卡数(64G显存)
最大序列(K)
max-model-len
开源权重获取地址
1
Qwen3-14B
√
x
v1
32
https://huggingface.co/Qwen/Qwen3-14B
2
Qwen3-30B-A3B
https://huggingface.co/Qwen/Qwen3-30B-A3B
3
Qwen3-32B
https://huggingface.co/Qwen/Qwen3-32B
上一篇:方案概述
下一篇:实施步骤
在使用文档中是否遇到以下问题
意见反馈(选填)
请至少选择一项反馈信息并填写问题反馈
字符长度不能超过500
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨