- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- 盘古大模型服务ModelArts Studio大模型开发平台使用流程
- 准备工作
- 在模型广场查看模型
- 使用数据工程构建数据集
- 开发盘古NLP大模型
- 开发盘古CV大模型
- 开发盘古预测大模型
- 开发盘古科学计算大模型
- 开发盘古搜索规划模型
- 开发盘古向量&重排模型
- 开发盘古行业大模型
- 开发Deepseek大模型
- 开发图像搜索模型
- 开发提示词工程
- 开发Agent应用
- 管理空间资产
- 管理资源池
- 最佳实践
- API参考
- SDK参考
-
常见问题
- 高频常见问题
- 大模型概念类
-
大模型微调训练类
- 无监督领域知识数据量无法支持增量预训练,如何进行模型学习
- 如何调整训练参数,使盘古大模型效果最优
- 如何判断盘古大模型训练状态是否正常
- 如何评估微调后的盘古大模型是否正常
- 如何调整推理参数,使盘古大模型效果最优
- 为什么微调后的盘古大模型总是重复相同的回答
- 为什么微调后的盘古大模型的回答中会出现乱码
- 为什么微调后的盘古大模型的回答会异常中断
- 为什么微调后的盘古大模型只能回答训练样本中的问题
- 为什么在微调后的盘古大模型中输入训练样本问题,回答完全不同
- 为什么微调后的盘古大模型评估结果很好,但实际场景表现很差
- 为什么多轮问答场景的盘古大模型微调效果不好
- 数据量足够,为什么盘古大模型微调效果仍然不好
- 数据量和质量均满足要求,为什么盘古大模型微调效果不好
- 大模型使用类
- 提示词工程类
- 视频帮助
- 文档下载
- 通用参考
链接复制成功!
Embedding模型服务
功能介绍
Embedding模型服务在创建知识库中,文本处理阶段,用于对文本文档进行前片,转换成向量化表示。在知识检索阶段,根据用户输入的query对切片进行召回。
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Auth-Token |
是 |
String |
用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 |
Content-Type |
是 |
String |
发送的实体的MIME类型,参数值为“application/json”。 |
使用API Key认证方式的请求Header参数见表 请求Header参数(API Key认证)。
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Apig-AppCode |
是 |
String |
API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 |
Content-Type |
是 |
String |
发送的实体的MIME类型,参数值为“application/json”。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
query |
是 |
String |
参数解释: query信息;支持在线输入query的embedding。 约束限制: 字符串长度限制:1~1000 取值范围: 不涉及 默认取值: 不涉及 |
embedding_type |
否 |
String |
参数解释: embedding的两种模式:query2query 和 query2doc。 约束限制: 不涉及 取值范围: query2query 和 query2doc。 默认取值: query2doc |
响应参数
状态码:200
参数 |
参数类型 |
描述 |
---|---|---|
embedding |
List[List[Float]] |
embedding的结果。 |
ret |
String |
错误码。 |
msg |
String |
错误信息。 |
cost |
Float |
模型推理耗时。 |
状态码: 400
参数 |
参数类型 |
描述 |
---|---|---|
ret |
String |
错误码。 |
msg |
String |
错误信息。 |
embedding |
List[List[Float]] |
embedding的结果,当错误时,是为空。 |
cost |
Float |
处理时间。 |
请求示例
POST /pangu/search/v1/vector/query \
--header 'Content-Type: application/json' \
--data '{
"query": "南京",
"embedding_type": "query2query"
}'
响应示例
{"embedding": [[0.30784764885902405, -0.0034346922766417265, 0.09973953664302826, -0.46510231494903564,...]], "ret": 0, "cost":
0.03413224220275879, "msg": "success"}
状态码
请参见状态码。
错误码
请参见错误码。