文档首页/
AI开发平台ModelArts/
最佳实践/
DeepSeek基于Lite Server&Cluster推理/
Qwen3模型基于ModelArts Lite Cluster适配Snt9b23的混部推理解决方案/
接入层部署(可选)/
调用API
更新时间:2025-09-08 GMT+08:00
调用API
执行调用命令。
curl -ik -H 'Content-Type: application/json' -d '{"messages":[{"role":"user","content":"请讲一个笑话"}],"model":"deepseek","temperature":0.6,"max_tokens":1024}' -X POST http://${ip}:${port}/v1/chat/completions
- ip:为购买ELB和WAF并接入WAF中ELB绑定的公网IP地址。
- port:为购买ELB和WAF并接入WAF中ELB监听的端口。
父主题: 接入层部署(可选)