AI工程师如何使用ModelArts
面向熟悉代码编写和调测,熟悉常见AI引擎的开发者,ModelArts不仅提供了在线代码开发环境,还提供了从数据准备、模型训练、模型管理到模型部署上线的端到端开发流程(即AI全流程开发),帮助您高效、快速的构建一个可用模型。
本文档介绍了如何在ModelArts管理控制台完成AI开发,如果您习惯使用API或者SDK进行开发,建议查看《ModelArts SDK参考》和《ModelArts API参考》获取帮助。
使用AI全流程开发的端到端示例,请参见使用MXNet构建模型和使用Notebook构建模型。使用预置算法构建模型的端到端示例,请参见AI初学者:使用预置算法构建模型。
AI全流程开发
ModelArts提供的AI全流程开发,兼容开发者的使用习惯,支持多种引擎和用户场景,使用自由度较高。下文介绍使用ModelArts平台,从准备数据到完成模型开发上线的全流程。针对开发者的其他场景,建议参考ModelArts使用流程详解。

流程 |
子任务 |
说明 |
详细指导 |
---|---|---|---|
准备数据 |
创建数据集 |
基于您的业务数据,您可以在ModelArts中创建数据集管理和预处理您的数据。 |
|
标注数据 |
针对您创建的数据集,基于业务逻辑标注数据,对数据进行预处理,方便后续训练使用。数据标注的情况将影响模型训练效果。 |
||
发布数据集 |
数据标注完成后,将数据集发布。即可生成一个可以用于模型训练的数据集版本。 |
||
开发 |
创建Notebook |
创建一个Notebook作为开发环境。 |
|
编写代码 |
在已有的Notebook中编写代码直接构建模型。 |
||
导出“py”文件 |
编写完成的训练脚本,导出成“py”文件才可以用于后续的模型训练、模型管理等操作。 |
||
训练模型 |
创建训练作业 |
创建一个训练作业,选择可用的数据集版本,然后上传并使用前面编写完成的训练脚本。训练完成后,将生成模型并存储至OBS中。 |
|
(可选)创建可视化作业 |
您可以通过创建可视化作业(TensorBoard类型)查看模型训练过程,您可以通过可视化作业提供信息,了解其模型情况,并对模型进行调整和优化。可视化作业当前仅针对MXNet和TensorFlow引擎。 |
||
管理模型 |
编写推理代码和配置文件 |
针对您生成的模型,建议您按照ModelArts提供的模型包规范,编写推理代码和配置文件,并将推理代码和配置文件存储至训练输出位置。 |
|
导入模型 |
将训练完成的模型导入至ModelArts,方便将模型部署上线。 |
||
部署模型 |
部署服务 |
ModelArts支持将模型部署为在线服务、批量服务和边缘服务。 |
|
访问服务 |
服务部署完成后,针对在线服务和边缘服务,您可以访问并使用服务,针对批量服务,您可以查看其预测结果。 |
