快速部署
本章节主要帮助用户快速部署“智能零售”解决方案。
配置节点 |
参数名称 |
类型 |
是否可选 |
参数解释 |
默认值 |
运行配置 |
output_dir |
string |
必填 |
选择一个OBS空目录存储训练输出的模型 |
空 |
ad_products_data_source |
string |
必填 |
选择广宣价签数据所在的OBS目录 |
空 |
|
sku_data_source |
string |
必填 |
选择SKU数据所在的OBS目录 |
空 |
|
翻拍模型训练 |
data_url |
string |
必填 |
翻拍模型输入的训练集OBS目录 |
空 |
eval_data_url |
string |
必填 |
翻拍模型输入的验证集OBS目录 |
空 |
|
相似度模型训练 |
data_url |
string |
必填 |
相似度模型输入的训练集OBS目录 |
空 |
eval_data_url |
string |
必填 |
相似度模型输入的验证集OBS目录 |
空 |
|
SKU检测-发布标注任务 |
sku_model_dir-release_data_dataset_input |
string |
必填 |
选择对应数据集及版本 |
空 |
切分检测数据集 |
sku_label_txt |
string |
必填 |
标准标签名称列表文件 |
空 |
sku_synonym_tx |
string |
必填 |
标签名称同义词映射表 |
空 |
|
场景识别模型训练 |
data_url |
string |
必填 |
场景识别模型输入的数据集OBS目录 |
空 |
发布模型 |
swr_model_step_input |
string |
必填 |
零售API使用的镜像地址 |
空 |
- 准备数据
1. 从AI Gallery下载零售体验数据集。
本示例使用AI Gallery中已有的数据集,您可以直接下载使用。
a. 打开零售体验数据集页面,单击“下载”。
b. 在“下载详情”页面,选择ModelArts数据集,并配置以下参数。
“目标区域”:选择“华北-北京四”。
“数据类型”:选择“图片”。
“数据集输出位置”: 在“请选择对象存储(OBS)路径”对话框中,选择准备工作中已创建的OBS桶,单击“创建文件夹”,创建一个命名为“retail”的文件夹,后再创建一个为“output”的子目录选择即可,此处的文件夹名称仅为举例,您可以自定义文件夹名称。
“数据集输入位置”: 在“请选择对象存储(OBS)路径”对话框中,选择准备工作中已创建的OBS桶,单击“创建文件夹”,创建一个命名为“retail”的文件夹,后再创建一个为“input”的子目录选择即可,此处的文件夹名称仅为举例,您可以自定义文件夹名称。
“名称和描述”:可根据实际情况填写,也可保持默认。
c. 单击“确定”,开始下载数据集至目标位置。
系统页面将自动跳转至“我的数据”页面,在“我的下载”页签下,可查看对应数据集的下载进度,数据集下载需要几分钟到十几分钟时间,请耐心等待。
2. (可选)使用自有数据。
如果您想使用自己的数据集,直接将数据上传至OBS文件夹中并使用数据管理创建相应的数据集。具体操作,请参见上传文件。
- 订阅Workflow
- 配置Workflow
- 登录ModelArts管理控制台,在控制台顶部区域下拉框中,选择“华北-北京四”。
- 在左侧导航栏,选择“Workflow”。
- 在Workflow列表中,单击Workflow所在行操作列的“配置”。
Workflow配置中各个节点的Workflow配置,请参见下表:
表1 Workflow配置信息表 配置节点
配置项
“运行配置”
“output_dir”:选择一个OBS空目录存储训练输出的模型。
“data_source”:选择上一步骤下载的input路径即可。
“资源配置”
各个训练节点资源保持默认即可
“消息通知”
订阅消息使用消息通知服务,在事件列表中选择需要监控的节点和Workflow状态,在事件发生时发送消息通知。您可以根据实际情况设置是否打开开关,如果开启订阅消息,请根据实际情况填写如下参数。
“主题名”:订阅消息主题名称。您可以单击创建主题,在消息通知服务中创建主题。
“订阅对象”:单击“增加订阅消息”,选择你需要的“订阅对象”和“订阅事件”。
说明
使用订阅消息服务会产生相关服务费用,详细信息请参见资费说明。
如果您订阅了节点事件,同时也订阅了Workflow事件,消息通知会重复发送。
“是否训练翻拍模型”
本次教程案例不涉及翻拍,此处无需修改保持默认即可。
“翻拍模型训练”
本次教程案例不涉及翻拍,输入的三个目录参数选择任意三个OBS目录即可。
“是否训练相似度模型”
本次教程案例不涉及相似度,此处无需修改保持默认即可。
“相似度模型训练”
本次教程案例不涉及相似度,输入的两个目录参数选择任意两个OBS目录即可。
“是否训练价签模型”
本次教程案例不涉及价签识别,此处无需修改保持默认即可。
“发布标注任务版本”
本次教程案例不涉及价签识别,输入的数据集选择任意一个数据集和任意一个版本即可。
“价签检测模型训练”
本次教程案例不涉及价签识别,此处无需修改保持默认即可。
“是否训练SKU模型”
需要将is_sku_train的开关打开。
“sku检测模型训练”
保持默认即可。
“切分检测数据”
这一步骤需要配置的参数为label_txt,其是标准标签名称列表文件,即本次标注的数据集使用了哪几个类别,选择OBS目录下事先准备好的txt文件即可。
synonym_txt参数的配置在第一次使用过程中选择一个空的txt文件即可。
“裁剪训练图片”
保持默认即可。
“裁剪验证图片”
保持默认即可。
“裁剪背景图片”
保持默认即可。
“清洗分类数据”
保持默认即可。
“分类算法训练”
保持默认即可。
“分类精度验证”
保持默认即可。
“提取训练特征”
保持默认即可。
“提取验证特征”
保持默认即可。
“是否训练SKU场景识别模型”
本次教程案例不涉及场景识别,此处无需修改保持默认即可。
“场景识别模型训练”
本次教程案例不涉及场景识别,输入选择任意一个OBS目录即可
“推理编排脚本”
保持默认即可。
“发布模型”
选择零售工作流需要的容器镜像。
4. 完成以上节点参数配置后,在Workflow页面右上角单击“保存配置”。
- 登录ModelArts管理控制台,在控制台顶部区域下拉框中,选择“华北-北京四”。
- 启动Workflow