文档首页/ 盘古大模型 PanguLargeModels/ 用户指南/ ModelArts Studio大模型开发平台使用流程
更新时间:2024-12-03 GMT+08:00
分享

ModelArts Studio大模型开发平台使用流程

盘古大模型服务简介

盘古大模型服务致力于深耕行业,打造多领域行业大模型和能力集。

ModelArts Studio大模型开发平台是盘古大模型服务推出的集数据管理、模型训练、模型部署于一体的综合平台,专为开发和应用大模型而设计,旨在为开发者提供简单、高效的大模型开发和部署方式。平台配备数据工程、模型开发、应用开发三大工具链,帮助开发者充分利用盘古大模型的功能。通过该平台,企业可根据需求选择合适的盘古NLP大模型、科学计算大模型等服务,便捷地构建自己的模型和应用
  • 数据工程工具链:数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分,具备数据获取、清洗、配比和管理等功能,确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的数据,满足不同训练任务的需求,并提供强大的数据存储和管理能力,为大模型训练提供坚实的数据支持。
  • 模型开发工具链:模型开发工具链是盘古大模型服务的核心组件,提供从模型创建到部署的一站式解决方案,涵盖模型训练、部署、推理等功能。通过高效推理性能和跨平台迁移工具,保障模型在不同环境中的稳定、高效应用。
  • 应用开发工具链:应用开发工具链是盘古大模型平台的重要模块,支持提示词工程、Agent应用开发与丰富的开发SDK,显著加速大模型应用的开发流程,帮助企业快速应对复杂业务需求。

预置模型使用流程

ModelArts Studio大模型开发平台提供了不同类型的预置模型,包括NLP大模型和科学计算大模型。用户可将预置模型部署为预置服务,用于后续的调用操作。

其中,NLP预置模型使用流程见图1表1科学计算预置模型使用流程见图2表2

图1 NLP预置模型使用流程图
表1 NLP预置模型使用流程表

流程

子流程

说明

操作指导

准备工作

申请试用盘古大模型服务

盘古大模型为用户提供了服务试用,用户可根据所需提交试用申请,申请通过后才可以试用盘古大模型功能。

申请试用盘古大模型服务

配置服务访问授权

为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。

配置服务访问授权

创建并管理盘古工作空间

平台支持用户自定义创建工作空间,并进行空间的统一管理。

创建并管理盘古工作空间

部署NLP大模型

创建NLP大模型部署任务

部署后的模型可用于后续调用操作。

创建NLP大模型部署任务

查看NLP大模型部署任务详情

查看部署任务的详情,包括部署的模型基本信息、任务日志等。

查看NLP大模型部署任务详情

管理NLP大模型部署任务

可对部署任务执行执行描述、删除等操作。

管理NLP大模型部署任务

调用NLP大模型

使用“能力调测”调用NLP大模型

使用该功能调用部署后的预置服务进行文本对话,支持设置人设和参数等。

使用“能力调测”调用NLP大模型、《快速入门》“使用盘古预置NLP大模型进行文本对话”

使用API调用NLP大模型

可调用API接口与NLP预置服务进行文本对话。

使用API调用NLP大模型、《快速入门》“调用盘古NLP大模型API实现文本对话”

图2 科学计算预置模型使用流程表
表2 科学计算预置模型使用流程表

流程

子流程

说明

操作指导

准备工作

申请试用盘古大模型服务

盘古大模型为用户提供了服务试用,用户可根据所需提交试用申请,申请通过后才可以试用盘古大模型功能。

申请试用盘古大模型服务

配置服务访问授权

为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。

配置服务访问授权

创建并管理盘古工作空间

平台支持用户自定义创建工作空间,并进行空间的统一管理。

创建并管理盘古工作空间

部署科学计算大模型

创建科学计算大模型部署任务

部署后的模型可用于后续调用操作。

创建科学计算大模型部署任务

查看科学计算大模型部署任务详情

查看部署任务的详情,包括部署的模型基本信息、任务日志等。

查看科学计算大模型部署任务详情

管理科学计算大模型部署任务

可对部署任务执行执行描述、删除等操作。

管理科学计算大模型部署任务

调用科学计算大模型

使用“能力调测”调用科学计算大模型

使用该功能调用部署后的预置服务对区域海洋要素等场景进行预测。

使用“能力调测”调用科学计算大模型

使用API调用科学计算大模型

可调用科学计算API接口对区域海洋要素等场景进行预测。

使用API调用科学计算大模型

数据工程使用流程

ModelArts Studio大模型开发平台提供了数据工程能力,帮助用户构造高质量的数据集,助力模型进行更好地预测和决策。

数据工程使用流程见图3表3

图3 数据工程使用流程图
表3 数据工程使用流程表

流程

子流程

说明

导入数据至盘古平台

创建原始数据集

数据集是指用于模型训练或评测的一组相关数据样本,上传至平台的数据将被创建为原始数据集进行统一管理。

上线原始数据集

在正式发布数据集前,需要执行上线操作。

加工数据集(可选)

创建数据集加工任务

数据集中若存在异常数据,可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。

上线加工后的数据集

对加工后的数据集执行上线操作。

标注数据集(可选)

创建数据集标注任务

创建数据集标注任务,并对数据集执行标注操作,标注后的数据可以用于模型训练。

审核数据集标注结果

对数据集的标注结果进行审核。

上线标注后的数据集

对标注后的数据集执行上线操作。

评估数据集(可选)

创建数据集评估标准

创建数据集评估标准。评估文本通顺性、信息充分性、内容有效性等。

创建数据集评估任务

创建数据集质量评估任务,并基于评估标注对数据逐一评估其质量,评估后的数据可以用于模型训练。

获取数据集评估报告

查看数据集评估任务的进展和数据集质量。

发布数据集

创建数据集发布任务

创建数据集发布任务,并进行正式的数据集发布操作,可用于后续的训练任务。

平台支持发布的数据集格式为默认格式、盘古格式,可按需进行数据集格式转换

  • 默认格式:平台默认的格式。
  • 盘古格式:训练盘古大模型时,需要进行数据集格式转换。当前仅文本类、图片类数据集支持转换为盘古格式。

NLP大模型开发流程

ModelArts Studio大模型开发平台提供了NLP大模型的全流程开发支持,涵盖了从数据处理到模型训练、压缩、部署、调用的各个环节。

NLP大模型开发流程见图4表4

图4 NLP大模型开发流程图
表4 NLP大模型开发流程表

流程

子流程

说明

操作指导

准备工作

申请试用盘古大模型服务

盘古大模型为用户提供了服务试用,用户可根据所需提交试用申请,申请通过后才可以试用盘古大模型功能。

申请试用盘古大模型服务

配置服务访问授权

为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。

配置服务访问授权

创建并管理盘古工作空间

平台支持用户自定义创建工作空间,并进行空间的统一管理。

创建并管理盘古工作空间

使用数据工程准备与处理数据集

导入数据至盘古平台

将用户数据导入至盘古平台的过程。

导入数据至盘古平台

创建文本类数据集加工任务

数据集中若存在异常数据,可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。

创建文本类数据集加工任务

创建文本类数据集标注任务

创建数据集标注任务,并对数据集执行标注操作,标注后的数据可以用于模型训练。

创建文本类数据集标注任务

创建文本类数据集评估任务

评估文本通顺性、信息充分性、内容有效性等。

创建文本类数据集评估任务

创建文本类数据集发布任务

创建数据集发布任务,并进行正式的数据集发布操作,可用于后续的训练任务。

平台支持发布的数据集格式为默认格式、盘古格式,可按需进行数据集格式转换

  • 默认格式:平台默认的格式。
  • 盘古格式:训练盘古大模型时,需要进行数据集格式转换。当前仅文本类、图片类数据集支持转换为盘古格式。

发布文本类数据集

开发盘古NLP大模型

训练NLP大模型

进行模型的训练,如预训练、微调等训练方式。

训练NLP大模型

压缩NLP大模型

通过模型压缩可以降低推理显存占用,节省推理资源提高推理性能。

压缩NLP大模型

部署NLP大模型

部署后的模型可进行调用操作。

部署NLP大模型

调用NLP大模型

支持“能力调测”功能与API两种方式调用大模型。

调用NLP大模型

盘古NLP大模型应用开发

开发盘古大模型提示词工程

辅助用户进行提示词撰写、比较和评估等操作,并对提示词进行保存和管理。

开发盘古大模型提示词工程

开发盘古大模型Agent应用

基于NLP大模型,致力打造智能时代集开发、调测和运行为一体的AI应用平台。无论开发者是否拥有大模型应用的编程经验,都可以通过Agent平台快速创建各种类型的智能体。

开发盘古大模型Agent应用

管理盘古大模型空间资产

管理盘古数据资产

管理已发布的数据集。

管理盘古数据资产

管理盘古模型资产

管理预置或训练后发布的模型。

管理盘古模型资产

科学计算大模型开发流程

ModelArts Studio大模型开发平台提供了科学计算大模型的全流程开发支持,涵盖了从数据处理到模型训练、部署、调用的各个环节。

科学计算大模型开发流程见图5表5

图5 科学计算大模型开发流程图
表5 科学计算大模型开发流程表

流程

子流程

说明

操作指导

准备工作

申请试用盘古大模型服务

盘古大模型为用户提供了服务试用,用户可根据所需提交试用申请,申请通过后才可以试用盘古大模型功能。

申请试用盘古大模型服务

配置服务访问授权

为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。

配置服务访问授权

创建并管理盘古工作空间

平台支持用户自定义创建工作空间,并进行空间的统一管理。

创建并管理盘古工作空间

使用数据工程准备与处理数据集

导入数据至盘古平台

将用户数据导入至盘古平台的过程。

导入数据至盘古平台

创建气象类数据集加工任务

数据集中若存在异常数据,可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。

创建气象类数据集加工任务

创建气象类数据集发布任务

创建数据集发布任务,并进行正式的数据集发布操作,可用于后续的训练任务。

发布气象类数据集

开发盘古科学计算大模型

训练科学计算大模型

进行模型的训练,如预训练、微调等训练方式。

训练科学计算大模型

部署科学计算大模型

部署后的模型可进行调用操作。

部署科学计算大模型

调用科学计算大模型

支持“能力调测”功能与API两种方式调用大模型。

调用科学计算大模型

管理盘古大模型空间资产

管理盘古数据资产

管理已发布的数据集。

管理盘古数据资产

管理盘古模型资产

管理预置或训练后发布的模型。

管理盘古模型资产

相关文档