MindSpore样例

MindSpore 是一个全场景 AI 计算框架，它的特性是可以显著减少训练时间和成本（开发态）、以较少的资源和最高能效比运行（运行态），同时适应包括端、边缘与云的全场景（部署态）。

本章介绍如何在模型训练服务上完成MindSpore样例体验，体验过程中使用的训练算法文件请从NAIE云服务论坛获取。需使用华为云账号登录后，才能下载附件，下载地址如下：

https://bbs.huaweicloud.com/forum/thread-59601-1-1.html

MindSpore体验样例共包含两个算法文件：

dataset.py
此算法文件用于加载cifar数据集，并进行简单的数据加强。用户体验MindSpore时，无需进行数据集和特征处理操作。
resnet.py
此算法文件为MindSpore体验样例的主入口函数文件，使用MindSpore自带的ResNet50残差网络，并定义了损失函数（SoftmaxCrossEntropyWithLogits）、优化方法（Momentum）、Checkpoint配置，完成网络结构的整体定义。同时作为主函数，定义了运行超参及其默认值，用户也可以通过模型训练服务超参配置，覆盖默认值。

单击“创建”，弹出“创建训练”对话框。
配置MindSpore样例训练工程参数，如图1所示。

图1 创建MindSpore样例训练工程
单击“确定”。

进入模型训练工程详情界面，如图2所示。

图2 模型训练工程详情界面
单击界面右上角的图标，进入代码编辑页面，如图3所示。

图3 代码编辑页面
单击界面左上角的图标，批量上传算法文件，如图4所示。

图4 上传算法文件
“resnet.py”文件有两种使用方式：
- 上传至训练工程的代码目录：进行模型训练时，主入口文件选择“resnet.py”。本文采用上传方式描述。
- 不上传至训练工程的代码目录：本地打开算法文件，将该算法文件内容拷贝至与训练工程同名的.py文件中。进行模型训练时，主入口文件选择与训练工程同名的.py文件。
单击“上传”。
单击界面右上角的“训练”。

进入“训练任务配置”页面。
配置训练任务，如图5所示。

参数配置说明如下：
- AI引擎：AI算法运行平台。从第一个下拉框中选择AI引擎“Ascend-Powered-Engine”，从第二个下拉框中选择匹配的python语言版本“MindSpore-0.5-python3.7-aarch64”。
- 主入口：MindSpore样例工程的主算法入口文件，此处选择“resnet.py”。
- 计算节点规格：MindSpore样例模型训练的资源配置信息。
- 计算节点个数：如果配置为“1”，表示使用1个节点进行训练；如果配置为2或者更大，表示使用分布式训练，开发者需要编写相应的调用代码。可使用内置的MoXing分布式训练加速框架进行训练，训练算法需要符合MoXing程序结构。可参考文档：
  https://github.com/huaweicloud/ModelArts-Lab/tree/master/docs/moxing_api_doc
- 数据集超参：已预置数据集超参配置，训练任务配置页面无须再配置。
- 运行超参：如图5所示为本样例的运行超参，用户可以自行调整超参值，也可以不设置运行超参，使用预置的超参进行训练。
  图5 配置MindSpore训练任务
单击“开始训练”。

系统返回代码编辑页面。
单击界面右上角的“训练任务”，查看训练任务。

待训练状态变为“Finished”时，可单击训练任务下方的图标，查看训练日志，如图6所示。“acc”值为模型精度。
图6 查看训练日志