更新时间:2021-09-18 GMT+08:00
分享

MindSpore样例

MindSpore 是一个全场景 AI 计算框架,它的特性是可以显著减少训练时间和成本(开发态)、以较少的资源和最高能效比运行(运行态),同时适应包括端、边缘与云的全场景(部署态)。

本章介绍如何在模型训练服务上完成MindSpore样例体验,体验过程中使用的训练算法文件请从NAIE云服务论坛获取。需使用华为云账号登录后,才能下载附件,下载地址如下:

https://bbs.huaweicloud.com/forum/thread-59601-1-1.html

MindSpore体验样例共包含两个算法文件:

  • dataset.py

    此算法文件用于加载cifar数据集,并进行简单的数据加强。用户体验MindSpore时,无需进行数据集和特征处理操作。

  • resnet.py

    此算法文件为MindSpore体验样例的主入口函数文件,使用MindSpore自带的ResNet50残差网络,并定义了损失函数(SoftmaxCrossEntropyWithLogits)、优化方法(Momentum)、Checkpoint配置,完成网络结构的整体定义。同时作为主函数,定义了运行超参及其默认值,用户也可以通过模型训练服务超参配置,覆盖默认值。

  1. 单击“创建”,弹出“创建训练”对话框。
  2. 配置MindSpore样例训练工程参数,如图1所示。

    图1 创建MindSpore样例训练工程

  3. 单击“确定”。

    进入模型训练工程详情界面,如图2所示。

    图2 模型训练工程详情界面

  4. 单击界面右上角的图标,进入代码编辑页面,如图3所示。

    图3 代码编辑页面

  5. 单击界面左上角的图标,批量上传算法文件,如图4所示。

    图4 上传算法文件

    “resnet.py”文件有两种使用方式:

    • 上传至训练工程的代码目录:进行模型训练时,主入口文件选择“resnet.py”。本文采用上传方式描述。
    • 不上传至训练工程的代码目录:本地打开算法文件,将该算法文件内容拷贝至与训练工程同名的.py文件中。进行模型训练时,主入口文件选择与训练工程同名的.py文件。

  6. 单击“上传”。
  7. 单击界面右上角的“训练”。

    进入“训练任务配置”页面。

  8. 配置训练任务,如图5所示。

    参数配置说明如下:

    • AI引擎:AI算法运行平台。从第一个下拉框中选择AI引擎“Ascend-Powered-Engine”,从第二个下拉框中选择匹配的python语言版本“MindSpore-0.5-python3.7-aarch64”。
    • 主入口:MindSpore样例工程的主算法入口文件,此处选择“resnet.py”。
    • 计算节点规格:MindSpore样例模型训练的资源配置信息。
    • 计算节点个数:如果配置为“1”,表示使用1个节点进行训练;如果配置为2或者更大,表示使用分布式训练,开发者需要编写相应的调用代码。可使用内置的MoXing分布式训练加速框架进行训练,训练算法需要符合MoXing程序结构。可参考文档:

      https://github.com/huaweicloud/ModelArts-Lab/tree/master/docs/moxing_api_doc

    • 数据集超参:已预置数据集超参配置,训练任务配置页面无须再配置。
    • 运行超参:如图5所示为本样例的运行超参,用户可以自行调整超参值,也可以不设置运行超参,使用预置的超参进行训练。
      图5 配置MindSpore训练任务

  9. 单击“开始训练”。

    系统返回代码编辑页面。

  10. 单击界面右上角的“训练任务”,查看训练任务。

    待训练状态变为“Finished”时,可单击训练任务下方的图标,查看训练日志,如图6所示。“acc”值为模型精度。
    图6 查看训练日志

相关文档