- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- 盘古大模型服务ModelArts Studio大模型开发平台使用流程
- 准备工作
- 在模型广场查看模型
- 使用数据工程构建数据集
- 开发盘古NLP大模型
- 开发盘古CV大模型
- 开发盘古预测大模型
- 开发盘古科学计算大模型
- 开发盘古搜索规划模型
- 开发盘古向量&重排模型
- 开发盘古行业大模型
- 开发Deepseek大模型
- 开发图像搜索模型
- 开发提示词工程
- 开发Agent应用
- 管理空间资产
- 管理资源池
- 最佳实践
- API参考
- SDK参考
-
常见问题
- 高频常见问题
- 大模型概念类
-
大模型微调训练类
- 无监督领域知识数据量无法支持增量预训练,如何进行模型学习
- 如何调整训练参数,使盘古大模型效果最优
- 如何判断盘古大模型训练状态是否正常
- 如何评估微调后的盘古大模型是否正常
- 如何调整推理参数,使盘古大模型效果最优
- 为什么微调后的盘古大模型总是重复相同的回答
- 为什么微调后的盘古大模型的回答中会出现乱码
- 为什么微调后的盘古大模型的回答会异常中断
- 为什么微调后的盘古大模型只能回答训练样本中的问题
- 为什么在微调后的盘古大模型中输入训练样本问题,回答完全不同
- 为什么微调后的盘古大模型评估结果很好,但实际场景表现很差
- 为什么多轮问答场景的盘古大模型微调效果不好
- 数据量足够,为什么盘古大模型微调效果仍然不好
- 数据量和质量均满足要求,为什么盘古大模型微调效果不好
- 大模型使用类
- 提示词工程类
- 视频帮助
- 文档下载
- 通用参考
链接复制成功!
搜索规划模型
功能介绍
Pangu-SearchPlan模型,用于RAG场景,提供通用意图分类/多轮查询改写/复杂查询分解/时间抽取等功能,在RAG任务中生产用于检索的query,以及根据query分类路由到后续不同的流程。
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Auth-Token |
是 |
String |
用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 |
Content-Type |
是 |
String |
发送的实体的MIME类型,参数值为“application/json”。 |
使用API Key认证方式的请求Header参数见表 请求Header参数(API Key认证)。
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Apig-AppCode |
是 |
String |
API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 |
Content-Type |
是 |
String |
发送的实体的MIME类型,参数值为“application/json”。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
query |
是 |
String |
参数解释: query信息。 约束限制: 字符串长度限制:1~1024 取值范围: 不涉及 默认取值: 不涉及 |
history |
否 |
List[String] |
参数解释: 多轮对话的query和answer。实现逻辑如下:
约束限制:
取值范围: 数组长度限制:0~50 字符串长度限制:0~4096 默认取值: 不涉及 |
响应参数
状态码:200
参数 |
参数类型 |
描述 |
---|---|---|
category |
String |
Query分类,对于行业知识类,建议使用前缀匹配。 闲聊类:坐火车累死了 语言任务类:请创作一封约460字的邮件,主题是咨询一个新的IT项目的细节,这个邮件将被发送给公司的IT项目经理。 人设类:你叫什么名字 通用知识类:豆汁和豆浆的区别 天气类:明天北京天气 行业知识类:
|
sub_queries |
List[String] |
多轮改写和复杂问题分解之后的子查询问题,可能包含多个值。 |
language |
String |
查询语言,编码对应 ISO 639-1。 zh:中文 en:英文 ar:阿语 fr:法语 th:泰语 mix:混合 unknown:未知 |
timeliness |
boolean |
时效性查询,比如今天天气怎么样 |
date_range |
String |
从query中抽取时间范围,抽取结果如: query: 2022年全网最高用电负荷最大时,外电入鲁电力是多少? date_range : 2022-01-01~2022-12-31 query: 华为一季度收入 date_range : 2024-01-01~2024-03-31 query: 今日时间 date_range: 2024-04-01 query: 2023年11月30日配套储能放电量是多少? date_range: 2023-11-30~2023-11-30 query: 两天前北京发生了什么大事 date_range: 2024-03-30~2024-03-30 当有多个子query时,用";"拼接如: query: 2023年第一季度山东和山西的GDP date_range: 2023-01-01~2023-03-31;2023-01-01~2023-03-31 |
calculation |
boolean |
计算类查询,比如经济增长率。 |
output_language |
String |
query是否涉及“请用xx语言回答”这样的表述,即会输出对应语言编码。如zh、en、ar、fr、th。无结果则输出""。 查询语言,编码对应 ISO 639-1。 |
cost |
float |
请求处理耗时,单位ms。 |
状态码: 400
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
错误码 |
error_msg |
String |
错误信息 |
请求示例
POST /app/search/v1/planning \
--header 'Content-Type: application/json' \
--data '
{
"query": "今天天气怎样?" ,
"history": []
}
'
响应示例
{
"sub_queries": [
"今天天气怎样?"
],
"category": "天气类",
"calculation": false,
"timeliness": true,
"language": "zh",
"output_language": "",
"date_range": "2025-05-15~2025-05-15",
"cost": 164.17336463928223
}
状态码
请参见状态码。
错误码
请参见错误码。