发起调用请求
功能介绍
调用已部署的大模型推理实例,发起推理请求。此接口为同步接口,无配套使用接口。该接口会有内容审核,对于不符合要求的内容会进行屏蔽,用户可以选择是否关闭。
调试
您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
URI
POST https://localhost.com/v1/workspaces/{workspace_id}/services/instances/{instance_id}/invocations
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
workspace_id |
是 |
String |
|
instance_id |
是 |
String |
|
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Auth-Token |
否 |
String |
|
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
messages |
否 |
Array of ChatMessage objects |
|
max_tokens |
否 |
Integer |
|
temperature |
否 |
Double |
|
top_p |
否 |
Double |
|
stream |
否 |
Boolean |
|
frequency_penalty |
否 |
Double |
|
presence_penalty |
否 |
Double |
|
n |
否 |
Integer |
|
响应参数
状态码:200
创建ChatCompletions的响应体。
状态码:400
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
|
error_msg |
String |
|
solution_msg |
String |
|
状态码:401
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
|
error_msg |
String |
|
solution_msg |
String |
|
状态码:404
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
|
error_msg |
String |
|
solution_msg |
String |
|
状态码:408
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
|
error_msg |
String |
|
solution_msg |
String |
|
状态码:500
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
|
error_msg |
String |
|
solution_msg |
String |
|
请求示例
调用已部署的大模型推理实例,发起推理请求。具体请求参数如下示例所示。
POST https://{endpoint}/v1/workspaces/{workspace_id}/services/instances/{instance_id}/invocations { "messages" : [ { "role" : "user", "content" : "请总结2023年LLM的发展" } ] }
响应示例
状态码:200
创建ChatCompletions的响应体。
{ "route_id" : "ac8111bf-3601-4905-8ddd-b41d3e636a4e" }
状态码:400
BadRequest
{ "error_code" : "common.01000001", "error_msg" : "failed to read http request, please check your input, code: 400, reason: Type mismatch., cause: TypeMismatchException" }
状态码:401
Unauthorized
{ "error_code" : "APIG.1002", "error_msg" : "Incorrect token or token resolution failed" }
状态码:403
Forbidden
{ "error" : { "code" : "403", "message" : "X-Auth-Token is invalid in the request", "title" : "Forbidden" }, "error_code" : 403, "error_msg" : "X-Auth-Token is invalid in the request", "title" : "Forbidden" }
状态码:404
NotFound
{ "error_code" : "common.01000001", "error_msg" : "response status exception, code: 404" }
状态码:408
Request Time-out
{ "error_code" : "common.00000408", "error_msg" : "timeout exception occurred" }
状态码:500
InternalServerError
{ "error_code" : "common.00000500", "error_msg" : "internal error" }
状态码
状态码 |
描述 |
---|---|
200 |
创建ChatCompletions的响应体。 |
400 |
BadRequest |
401 |
Unauthorized |
403 |
Forbidden |
404 |
NotFound |
408 |
Request Time-out |
500 |
InternalServerError |
错误码
请参见错误码。