ModelArts Studio大模型开发平台使用流程
盘古大模型服务简介
盘古大模型服务致力于深耕行业,打造多领域行业大模型和能力集。
- 数据工程工具链:数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分,具备数据获取、清洗、配比和管理等功能,确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的数据,满足不同训练任务的需求,并提供强大的数据存储和管理能力,为大模型训练提供坚实的数据支持。
- 模型开发工具链:模型开发工具链是盘古大模型服务的核心组件,提供从模型创建到部署的一站式解决方案,涵盖模型训练、部署、推理等功能。通过高效推理性能和跨平台迁移工具,保障模型在不同环境中的稳定、高效应用。
- 应用开发工具链:应用开发工具链是盘古大模型平台的重要模块,支持提示词工程、Agent应用开发与丰富的开发SDK,显著加速大模型应用的开发流程,帮助企业快速应对复杂业务需求。
预置模型使用流程
ModelArts Studio大模型开发平台提供了不同类型的预置模型,包括NLP大模型和科学计算大模型。用户可将预置模型部署为预置服务,用于后续的调用操作。
其中,NLP预置模型使用流程见图1、表1,科学计算预置模型使用流程见图2、表2。
流程 |
子流程 |
说明 |
操作指导 |
---|---|---|---|
准备工作 |
申请试用盘古大模型服务 |
盘古大模型为用户提供了服务试用,用户可根据所需提交试用申请,申请通过后才可以试用盘古大模型功能。 |
|
配置服务访问授权 |
为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。 |
||
创建并管理盘古工作空间 |
平台支持用户自定义创建工作空间,并进行空间的统一管理。 |
||
部署NLP大模型 |
创建NLP大模型部署任务 |
部署后的模型可用于后续调用操作。 |
|
查看NLP大模型部署任务详情 |
查看部署任务的详情,包括部署的模型基本信息、任务日志等。 |
||
管理NLP大模型部署任务 |
可对部署任务执行执行描述、删除等操作。 |
||
调用NLP大模型 |
使用“能力调测”调用NLP大模型 |
使用该功能调用部署后的预置服务进行文本对话,支持设置人设和参数等。 |
使用“能力调测”调用NLP大模型、《快速入门》“使用盘古预置NLP大模型进行文本对话” |
使用API调用NLP大模型 |
可调用API接口与NLP预置服务进行文本对话。 |
使用API调用NLP大模型、《快速入门》“调用盘古NLP大模型API实现文本对话” |
流程 |
子流程 |
说明 |
操作指导 |
---|---|---|---|
准备工作 |
申请试用盘古大模型服务 |
盘古大模型为用户提供了服务试用,用户可根据所需提交试用申请,申请通过后才可以试用盘古大模型功能。 |
|
配置服务访问授权 |
为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。 |
||
创建并管理盘古工作空间 |
平台支持用户自定义创建工作空间,并进行空间的统一管理。 |
||
部署科学计算大模型 |
创建科学计算大模型部署任务 |
部署后的模型可用于后续调用操作。 |
|
查看科学计算大模型部署任务详情 |
查看部署任务的详情,包括部署的模型基本信息、任务日志等。 |
||
管理科学计算大模型部署任务 |
可对部署任务执行执行描述、删除等操作。 |
||
调用科学计算大模型 |
使用“能力调测”调用科学计算大模型 |
使用该功能调用部署后的预置服务对区域海洋要素等场景进行预测。 |
|
使用API调用科学计算大模型 |
可调用科学计算API接口对区域海洋要素等场景进行预测。 |
数据工程使用流程
ModelArts Studio大模型开发平台提供了数据工程能力,帮助用户构造高质量的数据集,助力模型进行更好地预测和决策。
流程 |
子流程 |
说明 |
---|---|---|
导入数据至盘古平台 |
创建原始数据集 |
数据集是指用于模型训练或评测的一组相关数据样本,上传至平台的数据将被创建为原始数据集进行统一管理。 |
上线原始数据集 |
在正式发布数据集前,需要执行上线操作。 |
|
加工数据集(可选) |
创建数据集加工任务 |
数据集中若存在异常数据,可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。 |
上线加工后的数据集 |
对加工后的数据集执行上线操作。 |
|
标注数据集(可选) |
创建数据集标注任务 |
创建数据集标注任务,并对数据集执行标注操作,标注后的数据可以用于模型训练。 |
审核数据集标注结果 |
对数据集的标注结果进行审核。 |
|
上线标注后的数据集 |
对标注后的数据集执行上线操作。 |
|
评估数据集(可选) |
创建数据集评估标准 |
创建数据集评估标准。评估文本通顺性、信息充分性、内容有效性等。 |
创建数据集评估任务 |
创建数据集质量评估任务,并基于评估标注对数据逐一评估其质量,评估后的数据可以用于模型训练。 |
|
获取数据集评估报告 |
查看数据集评估任务的进展和数据集质量。 |
|
发布数据集 |
创建数据集发布任务 |
创建数据集发布任务,并进行正式的数据集发布操作,可用于后续的训练任务。 平台支持发布的数据集格式为默认格式、盘古格式,可按需进行数据集格式转换。
|
NLP大模型开发流程
ModelArts Studio大模型开发平台提供了NLP大模型的全流程开发支持,涵盖了从数据处理到模型训练、压缩、部署、调用的各个环节。
流程 |
子流程 |
说明 |
操作指导 |
---|---|---|---|
准备工作 |
申请试用盘古大模型服务 |
盘古大模型为用户提供了服务试用,用户可根据所需提交试用申请,申请通过后才可以试用盘古大模型功能。 |
|
配置服务访问授权 |
为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。 |
||
创建并管理盘古工作空间 |
平台支持用户自定义创建工作空间,并进行空间的统一管理。 |
||
使用数据工程准备与处理数据集 |
导入数据至盘古平台 |
将用户数据导入至盘古平台的过程。 |
|
创建文本类数据集加工任务 |
数据集中若存在异常数据,可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。 |
||
创建文本类数据集标注任务 |
创建数据集标注任务,并对数据集执行标注操作,标注后的数据可以用于模型训练。 |
||
创建文本类数据集评估任务 |
评估文本通顺性、信息充分性、内容有效性等。 |
||
创建文本类数据集发布任务 |
创建数据集发布任务,并进行正式的数据集发布操作,可用于后续的训练任务。 平台支持发布的数据集格式为默认格式、盘古格式,可按需进行数据集格式转换。
|
||
开发盘古NLP大模型 |
训练NLP大模型 |
进行模型的训练,如预训练、微调等训练方式。 |
|
压缩NLP大模型 |
通过模型压缩可以降低推理显存占用,节省推理资源提高推理性能。 |
||
部署NLP大模型 |
部署后的模型可进行调用操作。 |
||
调用NLP大模型 |
支持“能力调测”功能与API两种方式调用大模型。 |
||
盘古NLP大模型应用开发 |
开发盘古大模型提示词工程 |
辅助用户进行提示词撰写、比较和评估等操作,并对提示词进行保存和管理。 |
|
开发盘古大模型Agent应用 |
基于NLP大模型,致力打造智能时代集开发、调测和运行为一体的AI应用平台。无论开发者是否拥有大模型应用的编程经验,都可以通过Agent平台快速创建各种类型的智能体。 |
||
管理盘古大模型空间资产 |
管理盘古数据资产 |
管理已发布的数据集。 |
|
管理盘古模型资产 |
管理预置或训练后发布的模型。 |
科学计算大模型开发流程
ModelArts Studio大模型开发平台提供了科学计算大模型的全流程开发支持,涵盖了从数据处理到模型训练、部署、调用的各个环节。
流程 |
子流程 |
说明 |
操作指导 |
---|---|---|---|
准备工作 |
申请试用盘古大模型服务 |
盘古大模型为用户提供了服务试用,用户可根据所需提交试用申请,申请通过后才可以试用盘古大模型功能。 |
|
配置服务访问授权 |
为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。 |
||
创建并管理盘古工作空间 |
平台支持用户自定义创建工作空间,并进行空间的统一管理。 |
||
使用数据工程准备与处理数据集 |
导入数据至盘古平台 |
将用户数据导入至盘古平台的过程。 |
|
创建气象类数据集加工任务 |
数据集中若存在异常数据,可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。 |
||
创建气象类数据集发布任务 |
创建数据集发布任务,并进行正式的数据集发布操作,可用于后续的训练任务。 |
||
开发盘古科学计算大模型 |
训练科学计算大模型 |
进行模型的训练,如预训练、微调等训练方式。 |
|
部署科学计算大模型 |
部署后的模型可进行调用操作。 |
||
调用科学计算大模型 |
支持“能力调测”功能与API两种方式调用大模型。 |
||
管理盘古大模型空间资产 |
管理盘古数据资产 |
管理已发布的数据集。 |
|
管理盘古模型资产 |
管理预置或训练后发布的模型。 |