文档首页/
    
      
      AI开发平台ModelArts/
      
      
        
        
        最佳实践/
        
        
        DeepSeek&Qwen3基于Lite Server&Cluster推理/
        
        
        DeepSeek&Qwen3模型基于Lite Server适配NPU的PD分离推理解决方案/
        
        
        接入层部署(可选)/
        
      
      调用API
    
  
  
    
        更新时间:2025-10-16 GMT+08:00
        
          
          
        
      
      
      
      
      
      
      
      
  
      
      
      
        
调用API
执行调用命令。
curl -ik -H 'Content-Type: application/json' -d '{"messages":[{"role":"user","content":"请讲一个笑话"}],"model":"deepseek","temperature":0.6,"max_tokens":1024}' -X POST http://${ip}:${port}/v1/chat/completions
 - ip:为购买ELB和WAF并接入WAF中ELB绑定的公网IP地址。
 - port:为购买ELB和WAF并接入WAF中ELB监听的端口。
 
   父主题: 接入层部署(可选)