盘古专业大模型
盘古向量&重排大模型规格
盘古向量&重排大模型(Pangu-EmbeddingRank模型),用于大模型RAG场景。在文本处理阶段,将文本转换为向量化表示,以便进行检索。在文本检索阶段,对query进行相关度匹配,根据相关度在海量知识库中召回对应的切片,并对召回的切片进行精细化排序,以确保召回相关度top切片。
以下是Pangu-EmbeddingRank-zh大模型支持的模型清单,您可以根据实际需求选择模型进行开发和应用。
模型支持区域 |
模型名称 |
说明 |
---|---|---|
西南-贵阳一 |
Pangu-EmbeddingRank-zh-2.0.3 |
2024年12月份发布的版本,支持中文文档向量生成,1个推理单元可部署,最高支持6QPS |
盘古向量&重排大模型支持的平台操作
在选择和使用Pangu-EmbeddingRank-zh时,了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型压缩、在线推理和体验中心能力调测等方面的支持程度各不相同,开发者应根据自身需求选择合适的模型。以下是盘古专业大模型支持的具体操作:
模型 |
预训练 |
微调 |
模型压缩 |
在线推理 |
体验中心能力调测 |
---|---|---|---|---|---|
Pangu-EmbeddingRank-zh-2.0.3 |
- |
- |
- |
√ |
- |
盘古向量&重排模型对资源池的依赖
模型名称 |
云上部署 |
---|---|
Pangu-EmbeddingRank-zh-2.0.3 |
支持,1个推理单元部署 |
盘古搜索规划大模型规格
盘古搜索规划大模型(Pangu-SearchPlan模型),用于RAG场景,提供通用意图分类/多轮查询改写/复杂查询分解/时间抽取等功能,在RAG任务中生产用于检索的query,以及根据query分类路由到后续不同的流程。
ModelArts Studio大模型开发平台为用户提供了一种规格的Pangu-SearchPlan-ZH_EN大模型。以下是当前支持的模型清单,您可以根据实际需求选择最合适的模型进行开发和应用。
模型支持区域 |
模型名称 |
说明 |
---|---|---|
西南-贵阳一 |
Pangu-SearchPlan-ZH_EN-7.1.5.1 |
2024年12月份发布的版本,支持4K序列长度推理,1个推理单元可部署,最高支持10QPS。 |
盘古搜索规划大模型支持的平台操作
在选择和使用Pangu-SearchPlan-ZH_EN时,了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型压缩、在线推理和体验中心能力调测等方面的支持程度各不相同,开发者应根据自身需求选择合适的模型。以下是盘古专业大模型支持的具体操作:
模型 |
预训练 |
微调 |
模型压缩 |
在线推理 |
体验中心能力调测 |
---|---|---|---|---|---|
Pangu-SearchPlan-ZH_EN-7.1.5.1 |
- |
- |
- |
√ |
- |
盘古搜索规划模型对资源池的依赖
模型名称 |
云上部署 |
---|---|
Pangu-SearchPlan-ZH_EN-7.1.5.1 |
支持,1个推理单元部署 |