文档首页/
    
      
      AI开发平台ModelArts/
      
      
        
        
        最佳实践/
        
        
        DeepSeek&Qwen3基于Lite Server&Cluster推理/
        
        
        DeepSeek&Qwen3模型基于Lite Cluster适配NPU的PD分离推理解决方案/
        
        
        准备、安装部署依赖/
        
      
      获取Qwen系列权重文件
    
  
  
    
        更新时间:2025-10-14 GMT+08:00
        
          
          
        
      
      
      
      
      
      
      
      
  
      
      
      
        
获取Qwen系列权重文件
准备W8A8权重
参考W8A8量化实现对模型进行量化。
准备W8A8C8权重
参考kv-cache-int8量化实现对模型进行量化。
   父主题: 准备、安装部署依赖