Anthropic兼容接口
约束限制
该功能仅支持“西南-贵阳一”区域。
接口信息
| 名称 | 说明 | 取值 |
|---|---|---|
| API地址 | 调用模型服务的API地址。 | https://api.modelarts-maas.com/anthropic/v1/messages |
| 鉴权请求头 | 向服务器提供身份验证/授权凭证。 | "x-api-key":"$MaaS_API_Key" |
支持模型
| 模型系列 | 模型版本 | 支持地域 | model参数值 |
|---|---|---|---|
| DeepSeek | DeepSeek-V3 | 西南-贵阳一 | DeepSeek-V3 |
| DeepSeek-R1-0528 | 西南-贵阳一 | deepseek-r1-250528 | |
| DeepSeek-V3.1 | 西南-贵阳一 | deepseek-v3.1-terminus | |
| DeepSeek-V3.2 | 西南-贵阳一 | deepseek-v3.2 | |
| 通义千问3 | Qwen3-Coder-480B-A35B-Instruct | 西南-贵阳一 | qwen3-coder-480b-a35b-instruct |
| GLM | GLM-5 | 西南-贵阳一 | glm-5 |
| GLM-5.1 | 西南-贵阳一 | glm-5.1 | |
| Kimi | Kimi-K2.6 | 西南-贵阳一 | kimi-k2.6 |
您可以登录MaaS控制台,在“模型广场”页面的模型详情页面,查看模型的详细信息。
请求参数说明
| 参数类别 | 参数 | 参数类型 | 是否必填 | 取值范围 | 说明 |
|---|---|---|---|---|---|
| 通用 | model | string | 是 | - | 请求的模型ID。 默认值:不涉及。 |
| system | string | 否 | - | 系统提示词,可用于给模型指定特定的目标或角色。 默认值:不涉及。 | |
| messages | object[] | 是 | - | 对话组成的消息列表。不同模型支持不同类型的消息。 默认值:不涉及。 | |
| messages.role | enum<string> | 是 |
| 发送消息的角色。 默认值:不涉及。 | |
| messages.content | string/array | 是 | - | 当前角色发出的消息内容。 默认值:不涉及。 | |
| messages.content.type | enum<string> | 是 |
| 消息类型。 默认值:不涉及。 | |
| 工具调用结果部分(当messages.content.type的值为tool_result时) | messages.content.tool_use_id | string | 是 | - | 工具调用的ID。 默认值:不涉及。 |
| messages.content.content | string | 否 | - | 调用工具后获取的结果。 默认值:不涉及。 | |
| 深度思考控制 | thinking | object | 否 | - | 控制模型是否开启深度思考模式。 默认值:不涉及。 |
| thinking.type | string | 是 |
|
默认值:不同模型的默认值不同,详情请参见深度思考模型思考控制开关支持情况。 | |
| 模型输出行为配置 | max_tokens | integer/null | 否 | 各个模型不同,详细见模型详情页最大输出长度和最大思维链长度。 | 控制模型回答(仅content部分)的最大长度。配置了该参数后,模型输出content部分的Token长度不会超过max_tokens配置的值。 默认值:Kimi-K2.6为32K,其它模型为4K。 |
| temperature | number | 否 | [0.0, 1.0] | 采样温度,用于控制模型生成内容的随机性。 较高的值(如大于1)会使模型输出更加随机、发散、创造性高,而较低的值(如 0.1)会使输出更加集中确定、保守。 通常建议仅调整temperature或top_p其中之一,不建议两者都修改。 Kimi-K2.6会对输入值做特殊处理:思考模式下,无论用户输入值多少均为1.0;非思考模式下,无论用户输入值多少均为0.6。 默认值:其它模型1.0。 | |
| top_p | float/null | 否 | (0,1] | 核采样概率阈值,用于控制模型生成内容的多样性,和temperature参数类似,但原理不同,可以更精细地控制模型输出的词汇范围。
通常建议仅调整temperature或top_p其中之一,不建议两者都修改。 默认值:Kimi-K2.6:思考模式和非思考模式均为0.95,不支持修改。其它模型不涉及。 | |
| stream | boolean/null | 否 | - | 响应内容是否流式返回:
默认值:false。 | |
| stop_sequences | string[] | 否 | null | 当模型遇到stop_sequences字段中所指定的字符串时将停止继续生成。 stop Token不会命中思维链中的Token,仅会命中正式回答content中的部分。 默认值:不涉及。 | |
| 工具调用 | tools | array | 否 | - | 待调用工具的列表。 默认值:不涉及。 |
| tools.name | string | 是 | - | 调用的函数名称。 默认值:不涉及。 | |
| tools.description | string | 否 | - | 调用的函数描述,大模型会使用它来判断是否调用这个工具。 默认值:不涉及。 | |
| tools.input_schema | object | 否 | - | 函数请求参数,以JSON格式描述。示例如下: {
"type": "object",
"properties": {
"参数名": {
"type": "参数类型",
"description": "参数说明"
}
},
"required": ["必填参数"]
} parameters必须符合JSON规范。 默认值:不涉及。 |
响应参数说明(非流式)
| 参数 | 参数类型 | 说明 | |
|---|---|---|---|
| id | string | 响应对象的唯一标识ID。 | |
| type | enum<string> | 对于message类型,值为message。 | |
| role | string | 内容输出的角色。 | |
| model | string | 本次请求实际使用的模型名称和版本。 | |
| content | array | 模型生成的内容。 | |
| content.type | enum<string> | 生成的内容类型。 | |
| 深度思考部分响应(type: thinking) | content.thinking | string | 模型深度思考的内容。 |
| content.signature | string | 完整的思考内容被加密并返回在签名字段中。 | |
| 正式答复部分响应(type: text) | content.text | string | 模型正式答复的内容。 |
| 工具输入部分响应(type: tool_use) | content.id | string | 工具调用的ID。 |
| content.name | string | 调用的工具名称。 | |
| content.input | object | 调用工具需要的结构化输入信息。 | |
| 其余部分 | stop_reason | enum<string>/null | 模型停止生成Token的原因。取值范围:
|
| stop_sequence | string/null | 命中了哪一个自定义的stop_sequence。未命中则返回null。 | |
| usage | object | 本次请求的Token用量。 | |
| usage.output_tokens | integer | 模型输出内容花费的Token。 | |
| usage.input_tokens | integer | 输入给模型处理的内容Token数量。 | |
响应参数说明(流式)
| 参数 | 参数类型 | 说明 | |
|---|---|---|---|
| event | - | 包含如下几种类型:
| |
| event: message_start | type | string | 该chunk的类型。 |
| message | object[] | 响应消息。 | |
| message.id | string | 请求的唯一标识。 | |
| message.type | string | 响应消息类型,均为message。 | |
| message.role | string | 信息的角色。 | |
| message.model | string | 调用的model ID。 | |
| message.stop_sequence | string/null | 命中的stop sequence。 | |
| message.usage | object | 本次请求Token用量统计。 | |
| message.usage.input_tokens | integer | 输入Token数。 | |
| message.usage.output_tokens | integer | 输出Token数。 | |
| message.content | array | 模型输出内容。 | |
| message.stop_reason | enum<string>/null | 模型停止输出的原因。 | |
| event: content_block_start | type | string | 该chunk的类型。 |
| index | integer | 当前元素的索引。 | |
| content_block | object | 模型输出内容模块。 | |
| content_block.type | string | 输出内容类型。 | |
| content_block.thinking | string | 模型深度思考内容。 | |
| content_block.text | string | 模型正式答复内容。 | |
| content_block.id | string | 工具调用的ID。 | |
| content_block.name | string | 调用的工具名称。 | |
| content_block.input | object | 调用工具需要的结构化输入信息。 | |
| event: content_block_delta | type | string | 该chunk的类型。 |
| index | integer | 当前元素的索引。 | |
| delta | object | 模型输出的增量内容。 | |
| delta.type | string | 增量内容类型。 | |
| delta.text | string | 模型输出的增量文本内容。 | |
| delta.partial_json | string | 模型流式返回的工具调用所需JSON。 | |
| event: content_block_stop | type | string | 该chunk的类型。 |
| index | integer | 当前元素的索引。 | |
| event: message_delta | type | string | 该chunk的类型。 |
| delta | object | message的增量内容。 | |
| delta.stop_sequence | string/null | 命中的stop sequence。 | |
| delta.stop_reason | string | 模型停止输出的原因。 | |
| usage | enum<string>/null | 本次请求Token用量统计。 | |
| usage.output_tokens | integer | 输出Token数。 | |
| event: message_stop | type | string | 该chunk的类型。 |
| event: ping | type | string | 该chunk的类型。 |
深度思考模型思考控制开关支持情况
| 模型名称 | thinking.type默认值 | thinking.type支持的取值 |
|---|---|---|
| DeepSeek-R1-0528 | enabled | enabled |
| DeepSeek-V3.1 | disabled |
|
| DeepSeek-V3.2 | disabled |
|
| GLM-5 | enabled |
|
| GLM-5.1 | enabled |
|
| Kimi-K2.6 | enabled |
|
工具调用模型支持情况
| 模型名称 | 支持的tool choice |
|---|---|
| DeepSeek-R1-0528 | auto |
| DeepSeek-V3 | auto |
| DeepSeek-V3.1 | auto |
| DeepSeek-V3.2 | auto |
| Qwen3-Coder-480B-A35B-Instruct | auto |