Anthropic兼容接口
约束限制
该功能仅支持“西南-贵阳一”区域。
接口信息
|
名称 |
说明 |
取值 |
|---|---|---|
|
API地址 |
调用模型服务的API地址。 |
https://api.modelarts-maas.com/anthropic/v1/messages |
|
鉴权请求头 |
向服务器提供身份验证/授权凭证。 |
"x-api-key":"$MaaS_API_Key" |
支持模型
|
模型系列 |
模型版本 |
支持地域 |
model参数值 |
|---|---|---|---|
|
DeepSeek |
DeepSeek-V3-64K |
西南-贵阳一 |
DeepSeek-V3 |
|
DeepSeek-R1-64K |
西南-贵阳一 |
DeepSeek-R1 |
|
|
DeepSeek-R1-64K-0528 |
西南-贵阳一 |
deepseek-r1-250528 |
|
|
DeepSeek-V3.1 |
西南-贵阳一 |
deepseek-v3.1 |
|
|
DeepSeek-V3.2-Exp |
西南-贵阳一 |
deepseek-v3.2-exp |
您可以登录ModelArts Studio(MaaS)控制台,在模型广场的模型详情页面,查看模型的详细信息。
请求参数说明
|
参数类别 |
参数 |
参数类型 |
是否必填 |
取值范围 |
说明 |
|---|---|---|---|---|---|
|
通用 |
model |
string |
是 |
- |
请求的模型ID。 默认值:不涉及。 |
|
system |
string |
否 |
- |
系统提示词,可用于给模型指定特定的目标或角色。 默认值:不涉及。 |
|
|
messages |
object[] |
是 |
- |
对话组成的消息列表。不同模型支持不同类型的消息。 默认值:不涉及。 |
|
|
messages.role |
enum<string> |
是 |
|
发送消息的角色。 默认值:不涉及。 |
|
|
messages.content |
string/array |
是 |
- |
当前角色发出的消息内容。 默认值:不涉及。 |
|
|
messages.content.type |
enum<string> |
是 |
|
消息类型。 默认值:不涉及。 |
|
|
深度思考部分(当messages.content.type的值为thinking时) |
messages.content.thinking |
string |
是 |
- |
模型深度思考的内容。 默认值:不涉及。 |
|
messages.content.signature |
string |
是 |
- |
完整的思考内容被加密并返回在签名字段中。 默认值:不涉及。 |
|
|
工具调用结果部分(当messages.content.type的值为tool_result时) |
messages.content.tool_use_id |
string |
是 |
- |
工具调用的ID。 默认值:不涉及。 |
|
messages.content.content |
string |
否 |
- |
调用工具后获取的结果。 默认值:不涉及。 |
|
|
深度思考控制 |
thinking |
object |
否 |
- |
控制模型是否开启深度思考模式。 默认值:不涉及。 |
|
thinking.type |
string |
是 |
|
默认值:DeepSeek-V3.1、DeepSeek-V3.2模型默认为disabled。 |
|
|
模型输出行为配置 |
max_tokens |
integer/null |
否 |
各个模型不同,详细见模型详情页最大输出长度和最大思维链长度。 |
控制模型回答(仅content部分)的最大长度。配置了该参数后,模型输出content部分的Token长度不会超过max_tokens配置的值。 默认值:4096。 |
|
temperature |
number |
否 |
[0.0, 1.0] |
采样温度,用于控制模型生成内容的随机性。 较高的值(如大于1)会使模型输出更加随机、发散、创造性高,而较低的值(如 0.1)会使输出更加集中确定、保守。 通常建议仅调整temperature或top_p其中之一,不建议两者都修改。 默认值:1.0。 |
|
|
top_p |
float/null |
否 |
[0, 1] |
核采样概率阈值,用于控制模型生成内容的多样性,和temperature参数类似,但原理不同,可以更精细地控制模型输出的词汇范围。
通常建议仅调整temperature或top_p其中之一,不建议两者都修改。 默认值:不涉及。 |
|
|
stream |
boolean/null |
否 |
- |
响应内容是否流式返回:
默认值:false。 |
|
|
stop_sequences |
string[] |
否 |
null |
当模型遇到stop_sequences字段中所指定的字符串时将停止继续生成。 stop Token不会命中思维链中的Token,仅会命中正式回答content中的部分。 默认值:不涉及。 |
|
|
工具调用 |
tools |
array |
否 |
- |
待调用工具的列表。 默认值:不涉及。 |
|
tools.name |
string |
是 |
- |
调用的函数名称。 默认值:不涉及。 |
|
|
tools.description |
string |
否 |
- |
调用的函数描述,大模型会使用它来判断是否调用这个工具。 默认值:不涉及。 |
|
|
tools.input_schema |
object |
否 |
- |
函数请求参数,以JSON格式描述。示例如下: {
"type": "object",
"properties": {
"参数名": {
"type": "参数类型",
"description": "参数说明"
}
},
"required": ["必填参数"]
}
parameters必须符合JSON规范。 默认值:不涉及。 |
|
|
tool_choice |
string |
否 |
- |
控制模型返回是否包含待调用的工具。 默认值:不涉及。 |
响应参数说明(非流式)
|
参数 |
参数类型 |
说明 |
|
|---|---|---|---|
|
id |
string |
响应对象的唯一标识ID。 |
|
|
type |
enum<string> |
对于message类型,值为message。 |
|
|
role |
string |
内容输出的角色。 |
|
|
model |
string |
本次请求实际使用的模型名称和版本。 |
|
|
content |
array |
模型生成的内容。 |
|
|
content.type |
enum<string> |
生成的内容类型。 |
|
|
深度思考部分响应(type: thinking) |
content.thinking |
string |
模型深度思考的内容。 |
|
content.signature |
string |
完整的思考内容被加密并返回在签名字段中。 |
|
|
正式答复部分响应(type: text) |
content.text |
string |
模型正式答复的内容。 |
|
工具输入部分响应(type: tool_use) |
content.id |
string |
工具调用的ID。 |
|
content.name |
string |
调用的工具名称。 |
|
|
content.input |
object |
调用工具需要的结构化输入信息。 |
|
|
其余部分 |
stop_reason |
enum<string>/null |
模型停止生成Token的原因。取值范围:
|
|
stop_sequence |
string/null |
命中了哪一个自定义的stop_sequence。未命中则返回null。 |
|
|
usage |
object |
本次请求的Token用量。 |
|
|
usage.output_tokens |
integer |
模型输出内容花费的Token。 |
|
|
usage.input_tokens |
integer |
输入给模型处理的内容Token数量。 |
|
响应参数说明(流式)
|
参数 |
参数类型 |
说明 |
|
|---|---|---|---|
|
id |
string |
响应对象的唯一标识ID。 |
|
|
event |
- |
包含如下几种类型:
|
|
|
event: message_start |
type |
string |
该chunk的类型。 |
|
message |
object[] |
响应消息。 |
|
|
message.id |
string |
请求的唯一标识。 |
|
|
message.type |
string |
响应消息类型,均为message。 |
|
|
message.role |
string |
信息的角色。 |
|
|
message.model |
string |
调用的model ID。 |
|
|
message.stop_sequence |
string/null |
命中的stop sequence。 |
|
|
message.usage |
object |
本次请求Token用量统计。 |
|
|
message.usage.input_tokens |
integer |
输入Token数。 |
|
|
message.usage.output_tokens |
integer |
输出Token数。 |
|
|
message.content |
array |
模型输出内容。 |
|
|
message.stop_reason |
enum<string>/null |
模型停止输出的原因。 |
|
|
event: content_block_start |
type |
string |
该chunk的类型。 |
|
index |
integer |
当前元素的索引。 |
|
|
content_block |
object |
模型输出内容模块。 |
|
|
content_block.type |
string |
输出内容类型。 |
|
|
content_block.thinking |
string |
模型深度思考内容。 |
|
|
content_block.text |
string |
模型正式答复内容。 |
|
|
content_block.id |
string |
工具调用的ID。 |
|
|
content_block.name |
string |
调用的工具名称。 |
|
|
content_block.input |
object |
调用工具需要的结构化输入信息。 |
|
|
event: content_block_delta |
type |
string |
该chunk的类型。 |
|
index |
integer |
当前元素的索引。 |
|
|
delta |
object |
模型输出的增量内容。 |
|
|
delta.type |
string |
增量内容类型。 |
|
|
delta.text |
string |
模型输出的增量文本内容。 |
|
|
delta.partial_json |
string |
模型流式返回的工具调用所需JSON。 |
|
|
event: content_block_stop |
type |
string |
该chunk的类型。 |
|
index |
integer |
当前元素的索引。 |
|
|
event: message_delta |
type |
string |
该chunk的类型。 |
|
delta |
object |
message的增量内容。 |
|
|
delta.stop_sequence |
string/null |
命中的stop sequence。 |
|
|
delta.stop_reason |
string |
模型停止输出的原因。 |
|
|
usage |
enum<string>/null |
本次请求Token用量统计。 |
|
|
usage.output_tokens |
integer |
输出Token数。 |
|
|
event: message_stop |
type |
string |
该chunk的类型。 |
|
event: ping |
type |
string |
该chunk的类型。 |
深度思考模型思考控制开关支持情况
|
模型名称 |
thinking.type默认值 |
thinking.type支持的取值 |
|---|---|---|
|
DeepSeek-R1 |
enabled |
enabled |
|
DeepSeek-R1-0528 |
enabled |
enabled |
|
DeepSeek-V3.1 |
disabled |
|
|
DeepSeek-V3.2 |
disabled |
|
工具调用模型支持情况
|
模型名称 |
支持的tool choice |
|---|---|
|
DeepSeek-R1-0528 |
Auto |
|
DeepSeek-V3 |
Auto |
|
DeepSeek-V3.1 |
Auto |
|
DeepSeek-V3.2 |
Auto |