接入模型服务
本章节介绍如何在已接入的模型供应商下接入模型服务API。
为满足用户对模型的个性化与专业化需求,AgentArts支持接入由用户自建或第三方在外部环境部署的模型服务API。模型服务接入后,您可以在AgentArts中进行调测和发布,并在智能体中选择使用。
支持接入的模型类型
当前支持接入的模型类型如下:
- 文本对话(Chat)
- 文本向量化(Embeddings)
- 文本排序(Rerank)
- 图像理解
典型应用场景
- 接入企业自研的领域大模型,用于行业知识问答。
- 接入第三方向量模型,构建私有知识库检索能力。
- 接入图像理解模型,实现多模态智能体应用。
选型建议
| 模型类型 | 典型应用场景 |
|---|---|
| 文本对话 | 智能问答、对话机器人、文本生成 |
| 文本向量化 | 知识库检索、语义搜索、相似度计算 |
| 文本排序 | 搜索结果重排、推荐系统优化 |
| 图像理解 | 图像问答、多模态对话、图像分析 |
接口协议要求
- 文本对话、文本向量化、图像理解:标准OpenAI协议、阿里千问接口协议、MaaS标准API V1、MaaS标准API V2
- 文本排序:AI引擎标准协议
- 标准OpenAI协议和AI引擎标准协议规范请参考模型API接口规范。
- 阿里千问接口协议规范请参考通义千问的接口协议。
- MaaS标准API V1接口规范请参考MaaS标准API V1。
- MaaS标准API V2接口规范请参考MaaS标准API V2。
选型建议:优先选择与待接入模型原生匹配的协议。如果模型兼容OpenAI协议,推荐选择“标准OpenAI协议”以获得最佳兼容性。
费用说明
- 调用接入的第三方模型服务,费用由对应模型厂商收取,请参考其官网计费说明。
- AgentArts平台不对接入模型服务额外收费。
- 建议通过流控配置限制调用频率,避免意外产生高额费用。
新建模型服务
- 登录AgentArts智能体平台。
- 在左侧导航栏,选择“开发中心 > 开发配置”。
- 选择“自定义模型”页签,单击对应的模型供应商卡片,在“供应商详情”页面,单击“新建模型服务”。 图1 新建模型服务
- 在“新建模型服务”页面,配置参数信息,具体参数说明请参考表2。
表2 新建模型服务参数说明 参数
说明
示例
模型服务图标
系统默认模型服务图标,用户也可以自定义图标。
系统默认图标
模型服务名称
自定义模型服务名称。由2~64个字符组成,包含中英文、数字及:._/|\-,以中英文、数字开头结尾。
文本对话
模型名称
填写的模型名称必须为该模型的模型ID/模型编码,否则会导致模型不可用。
需要登录第三方模型厂商官网查看,例如,Baichuan4、deepseek-chat、glm-4-air。
如果要接入自建的模型服务,该模型名称将用于接口调用请求体的model字段。
由2~64个字符组成,包含中英文、数字及:._/|\-,以中英文、数字开头结尾。
deepseek-chat
类型
选择模型类型。
- 文本对话:文本对话模型,通常被称为对话式AI或聊天机器人,是一种经过训练能够理解和生成人类语言,并以多轮、上下文连贯的方式进行交流的人工智能系统。
- 文本向量化:文本向量化模型的核心任务是将文本(词、句、段落或文档)转换为计算机能够理解和处理的数值形式——即高维向量(也称为“嵌入”,Embedding)。这个向量就像是文本在数学空间中的一个“坐标点”。
- 文本排序:文本排序模型用于对一组文本对象进行相关度排序。给定一个查询(Query)和一个文本列表(如搜索引擎的结果),排序模型会根据每个文本与查询的相关程度,从高到低进行排序。
- 图像理解:图像理解模型是一种能够对图像内容进行分析、解读和理解的人工智能模型,其核心目标是让计算机像人类一样“看懂”图像。
文本对话
模型服务API地址
填入需要接入模型的API地址信息。字符长度不大于255个字符。
格式为:https://xxx.com/v1/xxx。
https://api.deepseek.com/chat/completions
API接口协议
- 当“类型”值为“文本对话”、“文本向量化”、“图像理解”时,选择“标准OpenAI协议”、“阿里千问接口协议”、“MaaS标准API V1”、“MaaS标准API V2”。
- 当“类型”值为“文本排序”时,选择“AI引擎标准协议”。
标准OpenAI协议和AI引擎标准协议规范请参考模型API接口规范。
阿里千问接口协议规范请参考通义千问的接口协议。
MaaS标准API V1接口规范请参考MaaS标准API V1。
MaaS标准API V2接口规范请参考MaaS标准API V2。
标准OpenAI协议
流控配置
超出流控值,则触发限流,用户的请求会因为流控而失败。建议根据模型API的QPS限制和业务并发需求选择,超出限制的请求将返回限流错误。
- 无限制
- 10次/秒
- 50次/秒
- 100次/秒
- 200次/秒
无限制
选择标签
可选项。
当“模型类型”值为“文本对话”、“图像理解”时,才有此参数。
选择标签后,在应用中选择大模型时,显示在大模型右侧。
工具:当该大模型支持应用调用外部工具(例如,MCP服务、插件、知识库)时,可以选择该标签。
思考:该大模型具备思维推理能力时,可以选择该标签。
联网:该大模型具备联网搜索能力时,可以选择该标签。
工具
是否支持关闭思维链输出
当“选择标签”选择了
思考时,才有此参数。关闭
自定义标签
选填项。
最多支持添加5个标签。单击
,输入标签内容,按Enter键。添加后,在应用中选择大模型时,显示在大模型右侧。
-
模型服务描述
选填项。
模型服务的描述信息。由0~1000个字符组成。
-
- 单击“确定”。
新建的模型服务,显示在模型供应商下的模型服务卡片列表中,默认状态为“未发布”。
- 在需要调测的模型服务卡片上,单击“
> 调测”,具体调测操作请参考调测模型。 - 在需要发布的模型服务卡片上,单击“
> 发布”。 发布后,模型服务状态为“已发布”。
模型服务卡片展示为“已发布”,才支持在智能体中使用。
- (可选)当已接入并发布多个同类型模型服务时,可配置模型路由策略实现模型故障自动切换,提升可用性。具体操作请参考配置模型路由策略。
相关操作
在接入模型服务卡片列表,支持的其他操作请参考表3。
相关文档
常见问题
- 接入的外部模型无法使用? 请依次检查以下事项:
- API Key是否正确粘贴,无多余空格或换行符。
- DeepSeek账户是否有可用余额。
- 模型服务API地址是否填写正确(https://api.deepseek.com/chat/completions)。
- “模型名称”参数是否填写了正确的模型编码(如deepseek-chat),而非自定义名称。
- API地址应该填基础路径还是完整路径? 需要填入模型服务商文档中给出的完整API地址,例如:
表4 模型API地址示例 模型服务商
API地址示例
DeepSeek
https://api.deepseek.com/v1/chat/completions
智谱
https://open.bigmodel.cn/api/paas/v4/chat/completions
不同模型服务商的路径结构不同(如智谱是/api/paas/v4/chat/completions,DeepSeek是/v1/chat/completions),请以服务商官方文档为准,填写完整地址。
- 接入自建模型需要注意什么?
“模型名称”字段必须与模型服务商定义的模型名称完全一致,这个值会直接作为接口请求体中model字段的值。随意填写会导致模型不可用。
模型名称需要到模型服务商官网查看,注意大小写和分隔符必须完全匹配。
- 可以接入本地部署的模型吗? 可以,但需要确保:
- 模型API对AgentArts平台可达(公网可访问)。
- API符合AgentArt平台中的模型对接协议。


