更新时间:2023-05-05 GMT+08:00
分享

ML Studio简介

ML Studio是什么

ML Studio简称MLS,是ModelArts中的一个支持可视化机器学习建模的企业级AI开发工具,支持用户通过浏览器以全代码、少代码甚至零代码的方式开发AI模型。

MLS提供了图形化模型探索开发环境、丰富的预置算子和预置算链,并支持编写自定义算子,可帮助开发者快速构建具有实用价值的机器学习应用。

MLS为AI开发者提供可视化的操作界面来编排机器学习模型的训练、评估和预测的过程,无缝衔接数据分析和预测应用,为用户的数据挖掘分析业务提供易用、高效、高性能的工具。

了解概念

  • 算子

    在MLS中,算子是一种基本功能单元,以ipynb格式保存,实质上是一段代码,对应Notebook中的一个Cell。

    在算子中,开发者可以通过代码的形式封装一系列变量、方法或类,从而实现一个独立功能。

    一个算子可以是一个机器学习算法的调用封装(比如调用Spark API封装一个随机森林算法),也可以是一个简单运算逻辑(比如完成一次简单加减运算),还可以是自行实现的任意功能脚本(比如从磁盘上读取数据)。

  • 算链

    算链是由若干算子通过一定规则组合而成的复合功能单元,以JSON格式进行保存,是一个大功能或解决方案的载体。

    算链中的算子之间可以通过有向无环图(DAG)的形式组合,也可不与任何算子组合,一个算链可包含若干个DAG或零散算子。

    在运行过程中,通过DAG形式组合的算子将严格按照DAG顺序调度运行,而未按DAG形式组合的算子则按照添加至算链的先后顺序运行。

    MLS中的一个算链可转换成一个ipynb文件或一个python文件,开发者可基于转换的文件做进一步开发。

亮点特性1:可视化建模

MLS提供了用户友好的可视化模型探索或开发环境,开发者只需要通过简单拖拉拽操作编排算子,构建算链即可完成机器学习建模。

MLS中一个算链由一组算子组成,每个算子是一个功能独立的逻辑单元,算子通过有向无环图(DAG)的形式组织。

在MLS中,开发者可在算链编排界面上直观便利地进行算子增删、算子连线、算子参数设置、算子代码修改及算子结果预览等操作,支持开发者以REPL(Read Eval Print Loop)交互式开发方式进行模型调测。

图1 ML Studio

亮点特性2:丰富的预置算子

MLS提供了丰富的预置算子,覆盖了机器学习建模全流程,包含数据分析、数据处理、特征工程、模型构建、模型评估和模型应用等多种算子类型,可极大程度地增强算法代码的可复用性,减少开发者的模型构建成本并提升开发效率。

开发者可以根据实际业务需要,方便快捷地设置预置算子参数、查看和修改预置算子源码,通过在算链中对预置算子进行参数调整和代码调整构建独特的业务场景需要的AI算法。

图2 丰富的预置算子

亮点特性3:提供高度开放的自定义算子开发环境

MLS提供了高度开放的自定义算子开发环境,开发者可以用自己习惯的方式编写MLS算子并拖拽至画布,构建算链完成模型构建。MLS支持全新编写自定义算子、上传自定义算子和基于预置算子开发自定义算子等方式构建贴合业务需求的个性化算子,打通业务开发全流程。

图3 自定义算子开发

使用方式

在Notebook开发环境中创建基于MLS引擎的Notebook实例,在JupyterLab页面打开并使用。

MLStudio使用要求浏览器为Chrome,版本为81及以上。

分享:

    相关文档

    相关产品