更新时间:2025-07-29 GMT+08:00
分享

盘古专业大模型

盘古向量&重排大模型规格

盘古向量&重排大模型(Pangu-EmbeddingRank模型),用于大模型RAG场景。在文本处理阶段,将文本转换为向量化表示,以便进行检索。在文本检索阶段,对query进行相关度匹配,根据相关度在海量知识库中召回对应的切片,并对召回的切片进行精细化排序,以确保召回相关度top切片。

以下是Pangu-EmbeddingRank-zh大模型支持的模型清单,您可以根据实际需求选择模型进行开发和应用。

表1 盘古向量&重排大模型规格清单

模型支持区域

模型名称

说明

西南-贵阳一

Pangu-EmbeddingRank-zh-2.0.3

2024年12月份发布的版本,支持中文文档向量生成,1个推理单元可部署,最高支持6QPS

盘古向量&重排大模型支持的平台操作

在选择和使用Pangu-EmbeddingRank-zh时,了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型压缩、在线推理和体验中心能力调测等方面的支持程度各不相同,开发者应根据自身需求选择合适的模型。以下是盘古专业大模型支持的具体操作:

表2 盘古向量&重排大模型支持的平台操作清单

模型

预训练

微调

模型压缩

在线推理

体验中心能力调测

Pangu-EmbeddingRank-zh-2.0.3

-

-

-

-

盘古向量&重排模型对资源池的依赖

表3 向量&重排模型对资源池的依赖

模型名称

云上部署

Pangu-EmbeddingRank-zh-2.0.3

支持,1个推理单元部署

盘古搜索规划大模型规格

盘古搜索规划大模型(Pangu-SearchPlan模型),用于RAG场景,提供通用意图分类/多轮查询改写/复杂查询分解/时间抽取等功能,在RAG任务中生产用于检索的query,以及根据query分类路由到后续不同的流程。

ModelArts Studio大模型开发平台为用户提供了一种规格的Pangu-SearchPlan-ZH_EN大模型。以下是当前支持的模型清单,您可以根据实际需求选择最合适的模型进行开发和应用。

表4 盘古搜索规划大模型规格清单

模型支持区域

模型名称

说明

西南-贵阳一

Pangu-SearchPlan-ZH_EN-7.1.5.1

2024年12月份发布的版本,支持4K序列长度推理,1个推理单元可部署,最高支持10QPS。

盘古搜索规划大模型支持的平台操作

在选择和使用Pangu-SearchPlan-ZH_EN时,了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型压缩、在线推理和体验中心能力调测等方面的支持程度各不相同,开发者应根据自身需求选择合适的模型。以下是盘古专业大模型支持的具体操作:

表5 盘古搜索规划大模型支持的平台操作清单

模型

预训练

微调

模型压缩

在线推理

体验中心能力调测

Pangu-SearchPlan-ZH_EN-7.1.5.1

-

-

-

-

盘古搜索规划模型对资源池的依赖

表6 搜索规划模型对资源池的依赖

模型名称

云上部署

Pangu-SearchPlan-ZH_EN-7.1.5.1

支持,1个推理单元部署

相关文档