文档首页/
AI开发平台ModelArts/
最佳实践/
DeepSeek&Qwen3基于Lite Server&Cluster推理/
DeepSeek&Qwen3模型基于ModelArts Lite Server适配NPU的PD分离推理解决方案/
准备、安装部署依赖/
获取Qwen系列权重文件
更新时间:2025-10-14 GMT+08:00
获取Qwen系列权重文件
准备W8A8权重
参考W8A8量化实现对模型进行量化。
准备W8A8C8权重
参考kv-cache-int8量化实现对模型进行量化。
父主题: 准备、安装部署依赖