更新时间:2023-09-06 GMT+08:00

AI工程师如何使用ModelArts

面向熟悉代码编写和调测,熟悉常见AI引擎的开发者,ModelArts不仅提供了在线代码开发环境,还提供了从数据准备、模型训练、模型管理到模型部署上线的端到端开发流程(即AI全流程开发),帮助您高效、快速的构建一个可用模型。

本文档介绍了如何在ModelArts管理控制台完成AI开发,如果您习惯使用API或者SDK进行开发,建议查看《ModelArts SDK参考》和《ModelArts API参考》获取帮助。

使用AI全流程开发的端到端示例,请参见快速入门最佳实践

AI全流程开发

ModelArts提供的AI全流程开发,兼容开发者的使用习惯,支持多种引擎和用户场景,使用自由度较高。下文介绍使用ModelArts平台,从准备数据到完成模型开发上线的全流程。

图1 AI工程师的使用流程
表1 使用流程说明

流程

子任务

说明

详细指导

准备数据

创建数据集

基于您的业务数据,您可以在ModelArts中创建数据集管理和预处理您的数据。

创建数据集

标注数据

针对您创建的数据集,基于业务逻辑标注数据,对数据进行预处理,方便后续训练使用。数据标注的情况将影响模型训练效果。

标注数据

发布数据集

数据标注完成后,将数据集发布。即可生成一个可以用于模型训练的数据集版本。

发布数据集

开发

创建Notebook

创建一个Notebook作为开发环境。

创建Notebook实例

编写调试代码

在已有的Notebook中编写代码直接构建模型。

JupyterLab简介及常用操作

训练模型

选择算法

创建训练作业前需要先选择算法,可以订阅ModelArts预置的算法,也可以使用自己的算法。

选择算法

创建训练作业

创建一个训练作业,并使用前面编写完成的训练脚本。训练完成后,将生成模型并存储至OBS中。

创建训练作业

管理AI应用

编写推理代码和配置文件

针对您生成的模型,建议您按照ModelArts提供的模型包规范,编写推理代码和配置文件,并将推理代码和配置文件存储至训练输出位置。

模型包规范介绍

创建AI应用

将训练完成的模型导入至ModelArts创建为AI应用,方便将AI应用部署上线。

创建AI应用

部署AI应用

部署服务

ModelArts支持将模型部署为在线服务或批量服务。

访问服务

服务部署完成后,针对在线服务,您可以访问并使用服务,针对批量服务,您可以查看其预测结果。