接入模型服务

本章节介绍如何在已接入的模型供应商下接入模型服务API。

为满足用户对模型的个性化与专业化需求，AgentArts支持接入由用户自建或第三方在外部环境部署的模型服务API。模型服务接入后，您可以在AgentArts中进行调测和发布，并在智能体中选择使用。

支持接入的模型类型

当前支持接入的模型类型如下：

文本对话（Chat）
文本向量化（Embeddings）
文本排序（Rerank）
图像理解

典型应用场景

接入企业自研的领域大模型，用于行业知识问答。
接入第三方向量模型，构建私有知识库检索能力。
接入图像理解模型，实现多模态智能体应用。

选型建议

表1 选型建议
模型类型	典型应用场景
文本对话	智能问答、对话机器人、文本生成
文本向量化	知识库检索、语义搜索、相似度计算
文本排序	搜索结果重排、推荐系统优化
图像理解	图像问答、多模态对话、图像分析

接口协议要求

为保证接入模型服务的质量，模型API接入前请确保其符合对应的接口协议规范。不同模型类型支持的接口协议如下：

文本对话、文本向量化、图像理解：标准OpenAI协议、阿里千问接口协议、MaaS标准API V1、MaaS标准API V2
文本排序：AI引擎标准协议
- 标准OpenAI协议和AI引擎标准协议规范请参考模型API接口规范。
- 阿里千问接口协议规范请参考通义千问的接口协议。
- MaaS标准API V1接口规范请参考MaaS标准API V1。
- MaaS标准API V2接口规范请参考MaaS标准API V2。

选型建议：优先选择与待接入模型原生匹配的协议。如果模型兼容OpenAI协议，推荐选择“标准OpenAI协议”以获得最佳兼容性。

费用说明

调用接入的第三方模型服务，费用由对应模型厂商收取，请参考其官网计费说明。
AgentArts平台不对接入模型服务额外收费。
建议通过流控配置限制调用频率，避免意外产生高额费用。

前提条件

已接入模型供应商。

已获取待接入模型服务的必要信息，例如API地址、鉴权信息（API Key等）、模型名称（模型ID/模型编码）及协议类型。

新建模型服务

登录AgentArts智能体平台。
在左侧导航栏，选择“开发中心 > 开发配置”。
选择“自定义模型”页签，单击对应的模型供应商卡片，在“供应商详情”页面，单击“新建模型服务”。

图1 新建模型服务

在“新建模型服务”页面，配置参数信息，具体参数说明请参考表2。

表2 新建模型服务参数说明
参数	说明	示例
模型服务图标	系统默认模型服务图标，用户也可以自定义图标。鼠标移动至系统默认图标上，单击鼠标左键。在虚线框中，单击鼠标左键，上传已准备好的模型服务图标。支持jpg、png格式图片，且不大于100KB。	系统默认图标
模型服务名称	自定义模型服务名称。由2~64个字符组成，包含中英文、数字及:._/\|\-，以中英文、数字开头结尾。	文本对话
模型名称	填写的模型名称必须为该模型的模型ID/模型编码，否则会导致模型不可用。需要登录第三方模型厂商官网查看，例如，Baichuan4、deepseek-chat、glm-4-air。如果要接入自建的模型服务，该模型名称将用于接口调用请求体的model字段。由2~64个字符组成，包含中英文、数字及:._/\|\-，以中英文、数字开头结尾。	deepseek-chat
类型	选择模型类型。文本对话：文本对话模型，通常被称为对话式AI或聊天机器人，是一种经过训练能够理解和生成人类语言，并以多轮、上下文连贯的方式进行交流的人工智能系统。文本向量化：文本向量化模型的核心任务是将文本（词、句、段落或文档）转换为计算机能够理解和处理的数值形式——即高维向量（也称为“嵌入”，Embedding）。这个向量就像是文本在数学空间中的一个“坐标点”。文本排序：文本排序模型用于对一组文本对象进行相关度排序。给定一个查询（Query）和一个文本列表（如搜索引擎的结果），排序模型会根据每个文本与查询的相关程度，从高到低进行排序。图像理解：图像理解模型是一种能够对图像内容进行分析、解读和理解的人工智能模型，其核心目标是让计算机像人类一样“看懂”图像。	文本对话
模型服务API地址	填入需要接入模型的API地址信息。字符长度不大于255个字符。格式为：https://xxx.com/v1/xxx。	https://api.deepseek.com/chat/completions
API接口协议	当“类型”值为“文本对话”、“文本向量化”、“图像理解”时，选择“标准OpenAI协议”、“阿里千问接口协议”、“MaaS标准API V1”、“MaaS标准API V2”。当“类型”值为“文本排序”时，选择“AI引擎标准协议”。标准OpenAI协议和AI引擎标准协议规范请参考模型API接口规范。阿里千问接口协议规范请参考通义千问的接口协议。 MaaS标准API V1接口规范请参考MaaS标准API V1。 MaaS标准API V2接口规范请参考MaaS标准API V2。	标准OpenAI协议
流控配置	超出流控值，则触发限流，用户的请求会因为流控而失败。建议根据模型API的QPS限制和业务并发需求选择，超出限制的请求将返回限流错误。无限制 10次/秒 50次/秒 100次/秒 200次/秒	无限制
选择标签	可选项。当“模型类型”值为“文本对话”、“图像理解”时，才有此参数。选择标签后，在应用中选择大模型时，显示在大模型右侧。工具：当该大模型支持应用调用外部工具（例如，MCP服务、插件、知识库）时，可以选择该标签。思考：该大模型具备思维推理能力时，可以选择该标签。联网：该大模型具备联网搜索能力时，可以选择该标签。	工具
是否支持关闭思维链输出	当“选择标签”选择了思考时，才有此参数。开启：模型在调测、使用时，显示“深度思考”参数。在模型的调测和使用过程中，“深度思考”开关的生效情况如下：如果模型支持思维链输出能力，并且也支持关闭该能力，则开启、关闭均生效。如果模型支持思维链输出能力，但不支持关闭该能力，则开启生效、关闭不生效。如果模型不支持思维链输出能力，则开启、关闭均不生效。关闭：模型在调测、使用时，不显示“深度思考”参数。默认关闭。模型在调测、使用时，是否输出思维链，取决于模型本身是否支持思维链输出。	关闭
自定义标签	选填项。最多支持添加5个标签。单击，输入标签内容，按Enter键。添加后，在应用中选择大模型时，显示在大模型右侧。	-
模型服务描述	选填项。模型服务的描述信息。由0~1000个字符组成。	-

单击“确定”。

新建的模型服务，显示在模型供应商下的模型服务卡片列表中，默认状态为“未发布”。
在需要调测的模型服务卡片上，单击“ > 模型调测”，具体调测操作请参考调测模型。
在需要发布的模型服务卡片上，单击“ > 发布”。

发布后，模型服务状态为“已发布”。

模型服务卡片展示为“已发布”，才支持在智能体中使用。
（可选）当已接入并发布多个同类型模型服务时，可配置模型路由策略实现模型故障自动切换，提升可用性。具体操作请参考配置模型路由策略。

表3 接入模型服务相关操作
操作	说明
查看模型服务信息	单击模型服务卡片，进入模型服务详情页，可以查看模型服务信息。
修改模型服务信息	注意：未发布的模型服务，才可以修改。在需要修改的模型服务卡片上，单击“ > 编辑”。
取消发布	注意：已发布的模型服务，才可以取消发布。未发布的模型服务，不支持使用。在需要取消发布的模型服务卡片上，单击“ > 取消发布”。
删除模型服务	警告：删除模型服务后，使用该模型的智能体将无法正常工作。删除操作不可恢复，请确认无智能体正在使用该模型后再执行。已发布的模型服务，需先取消发布才能删除。在需要删除的模型服务卡片上，单击“ > 删除”。

常见问题

接入的外部模型无法使用？
请依次检查以下事项：
- API Key是否正确粘贴，无多余空格或换行符。
- DeepSeek账户是否有可用余额。
- 模型服务API地址是否填写正确（https://api.deepseek.com/chat/completions）。
- “模型名称”参数是否填写了正确的模型编码（如deepseek-chat），而非自定义名称。
API地址应该填基础路径还是完整路径？
需要填入模型服务商文档中给出的完整API地址，例如：

表4 模型API地址示例

模型服务商

API地址示例

DeepSeek

https://api.deepseek.com/v1/chat/completions

智谱

https://open.bigmodel.cn/api/paas/v4/chat/completions

不同模型服务商的路径结构不同（如智谱是/api/paas/v4/chat/completions，DeepSeek是/v1/chat/completions），请以服务商官方文档为准，填写完整地址。
接入自建模型需要注意什么？
“模型名称”字段必须与模型服务商定义的模型名称完全一致，这个值会直接作为接口请求体中model字段的值。随意填写会导致模型不可用。

模型名称需要到模型服务商官网查看，注意大小写和分隔符必须完全匹配。
可以接入本地部署的模型吗？
可以，但需要确保：
- 模型API对AgentArts平台可达（公网可访问）。
- API符合AgentArt平台中的模型对接协议。