文档首页/
    
      
      AI开发平台ModelArts/
      
      
        
        
        最佳实践/
        
        
        DeepSeek&Qwen3基于Lite Server&Cluster推理/
        
        
        DeepSeek&Qwen3模型基于Lite Cluster适配NPU的PD分离推理解决方案/
        
        
        权重量化补充说明/
        
      
      MTP融合权重
    
  
  
    
        更新时间:2025-10-16 GMT+08:00
        
          
          
        
      
      
      
      
      
      
      
      
  
      
      
      
        
MTP融合权重
开启MTP特性,--model 指定融合权重路径。
需要修改W8A8量化替换配置文件 - config.json两个字段。
  "architectures": [
    "DeepseekV3Fusion"       # DeepseekV3ForCausalLM修改为DeepseekV3Fusion
  ],
  ......
  "num_hidden_layers": 62,   # 61修改为62
  ......
   父主题: 权重量化补充说明