- 功能总览
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- 盘古大模型服务ModelArts Studio大模型开发平台使用流程
- 准备工作
- 在模型广场查看模型
- 使用数据工程构建数据集
- 开发盘古NLP大模型
- 开发盘古CV大模型
- 开发盘古预测大模型
- 开发盘古科学计算大模型
- 开发盘古搜索规划模型
- 开发盘古向量&重排模型
- 开发盘古行业大模型
- 开发Deepseek大模型
- 开发图像搜索模型
- 开发提示词工程
- 开发Agent应用
- 管理空间资产
- 管理资源池
- 最佳实践
- API参考
- SDK参考
-
常见问题
- 高频常见问题
- 大模型概念类
-
大模型微调训练类
- 无监督领域知识数据量无法支持增量预训练,如何进行模型学习
- 如何调整训练参数,使盘古大模型效果最优
- 如何判断盘古大模型训练状态是否正常
- 如何评估微调后的盘古大模型是否正常
- 如何调整推理参数,使盘古大模型效果最优
- 为什么微调后的盘古大模型总是重复相同的回答
- 为什么微调后的盘古大模型的回答中会出现乱码
- 为什么微调后的盘古大模型的回答会异常中断
- 为什么微调后的盘古大模型只能回答训练样本中的问题
- 为什么在微调后的盘古大模型中输入训练样本问题,回答完全不同
- 为什么微调后的盘古大模型评估结果很好,但实际场景表现很差
- 为什么多轮问答场景的盘古大模型微调效果不好
- 数据量足够,为什么盘古大模型微调效果仍然不好
- 数据量和质量均满足要求,为什么盘古大模型微调效果不好
- 大模型使用类
- 提示词工程类
- 视频帮助
- 文档下载
- 通用参考
展开导读
链接复制成功!
概述
盘古大模型整合华为云强大的计算和数据资源,将先进的AI算法集成在预训练大模型中,打造出具有深度语义理解与生成能力的人工智能大语言模型。可进行对话互动、回答问题、协助创作。
盘古大模型在ModelArts Studio大模型开发平台部署后,可以通过API调用推理接口。
类别 |
模型 |
API |
功能 |
---|---|---|---|
模型推理接口 |
NLP大模型 |
基于对话问答功能,用户可以与模型进行自然而流畅的对话和交流。 |
|
科学计算大模型 |
支持调用科学计算大模型创建气象/降水模型的推理作业。 |
||
根据创建推理作业的作业ID获取科学计算大模型的结果数据。 |
|||
CV大模型 |
根据在图像信息中所反映的不同特征,对图像进行定量分析,把图像划归为若干个类别中的某一种。适用于动植物分类、车辆类型分类、车牌分类、废钢定级、零部件分类等任务。 |
||
找出图像中所有感兴趣的目标,确定它们的位置和类别。物体检测-S模型特点是小参数量,适合在资源有限的环境中使用,提供较快的检测速度和合理的精度。 |
|||
找出图像中所有感兴趣的目标,确定它们的位置和类别。物体检测-N模型特点是参数量适中,适合在资源有限的环境中使用,提供较快的检测速度和合理的精度。 |
|||
预测大模型 |
基于时序预测基模型实现分类预测能力。时序分类预测有很多应用场景,例如:基于工业设备传感器一段时间采集的连续数据,实现设备正常或异常状态的预测。 |
||
2025年3月首次发布的模型,基于时序预测基模型实现对未来一组观测值的预测,最多支持128个未来时间点的预测。 |
|||
针对特定场景的异常检测任务,用户传入异常检测数据,使用模型对指定的预测目标进行异常检测预测。 |
|||
数据分类预测-盘古融合推荐分类大模型 |
针对特定场景的分类任务,用户传入分类数据,使用模型对指定的预测目标进行分类预测。 |
||
排列特征重要性-盘古融合推荐分类大模型 |
支持用户传入一批数据样本,并据此计算各个特征的排列重要性(permutation importance)。 |
||
数据回归预测-盘古融合推荐回归大模型 |
针对特定场景的回归任务,用户传入回归数据,使用模型对指定的预测目标进行回归预测。 |
||
排列特征重要性-盘古融合推荐回归大模型 |
支持用户传入一批数据样本,并据此计算各个特征的排列重要性(permutation importance)。 |
||
向量&重排专业大模型 |
Embedding模型服务在创建知识库中,文本处理阶段,用于对文本文档进行前片,转换成向量化表示。在知识检索阶段,根据用户输入的query对切片进行召回。 |
||
Rerank模型服务用于对召回的切片,按照query与切片的相关度进行精细化排序,以确保召回相关度top切片。 |
|||
专业大模型 |
Pangu-EmbeddingRank模型,用于RAG场景,提供文本向量化。 |
||
Pangu-EmbeddingRank模型,用于RAG场景,提供精排。 |
|||
Pangu-SearchPlan模型,用于RAG场景,提供通用意图分类/多轮查询改写/复杂查询分解/时间抽取等功能,在RAG任务中生产用于检索的query,以及根据query分类路由到后续不同的流程。 |
|||
行业大模型 |
基于文本对话功能,用户可以与医学行业大模型进行自然而流畅的对话和交流,实现医学领域的文本生成、行业推理等场景 |
||
三方大模型 |
DeepSeek API是基于DeepSeek大模型推出的接口服务,它支持多场景文本交互,能够快速生成高质量对话、文案、故事等内容,可用于文本摘要、智能问答、内容创作等场景。 |
||
数据工程接口 |
- |
客户通过obs导入原始数据集,可基于该obs路径查询所有基于该路径创建的原始数据集及后续的血缘信息。 |
|
- |
只针对从obs上传的数据,在删除数据集的时候要关联删除OBS下对应的原始数据,客户认为原始数据应该在客户侧大数据中心长期归档,不应该在OBS长期保留。 |
||
Agent应用接口 |
- |
通过调用创建好的应用API,输入问题,将得到应用执行的结果。 |
|
- |
通过调用创建好的工作流API,输入问题,将得到工作流执行的结果。 |
||
Token计算器 |
- |
为了帮助用户更好地管理和优化Token消耗,平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量,提供费用预估,并优化数据预处理策略。 |
用户在部署服务的过程中,建议开启“安全护栏”功能,以保证内容的安全性。