使用多模板工作流开发应用
ModelArts Pro的文字识别套件提供了多模板工作流,通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量不同板式图像中提取结构化信息。
本章节提供一个票证类型的样例,帮助您快速熟悉使用文字识别套件中的多模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识别区、上传训练集,自动训练并生成模板分类器和文字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务自动分类模板并识别模板中的文字。
首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用多模板分类工作流开发应用的步骤如下所示:
步骤1:准备数据
在本地准备好用于制作模板的图片、用于训练多模板分类器的训练集、用于评估模板的图片,图片要求如下:
- 只支持PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在100px到4096px之间。
- 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
- 支持图像任意角度的水平旋转。
- 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。
- 用于训练多模板分类器的训练集,需要把各个模板的训练图片打包成一个文件夹并压缩成“zip”包,“zip”包文件大小不超过10M。
例如训练“保险单”模板的训练集,需要把同模板的保险单图片打包成一个文件夹并压缩成“zip”包。
步骤2:新建应用
- 登录ModelArts Pro控制台,单击“文字识别”套件卡片的“进入套件”。
默认进入“应用开发>工作台”页面的“我的应用”页签。
图1 进入套件
- 在“我的应用”页签下,单击“新建应用”。
进入“新建应用”页面。
图2 新建应用
- 根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。
本样例“工作流”选择“多模板分类工作流”。
图3 新建应用
- 确认信息后,单击右下角的“确定”。
成功新建应用,进入“应用资产”页面。
步骤3:上传多个模板图片
- 在“应用资产”页面单击模板列表下方的“创建分类器”。
进入“应用开发>上传模板图片”页面。
图4 创建分类器
- 输入多模板分类器的“名称”和“描述”。
图5 基本信息
- 在“新增模板配置”页签下,单击下方的添加模板图标,配置第一个模板信息。
本样例选择“模板类型”为“票证”。
单击“上传图片”区域,上传提前在本地准备好的用于制作模板的图片。
单击上传图片右侧的,更改模板名称为“保险单”。
图6 模板1
- 单击添加模板图标,配置第二个模板信息。
本样例选择“模板类型”为“票证”。
单击“上传图片”区域,上传提前在本地准备好的用于制作模板的图片。
单击上传图片右侧的,更改模板名称为“增值税”。
图7 上传模板图片
- 单击右下角的“下一步”。
进入“应用开发>定义预处理”页面。
步骤4:定义预处理
- 在“应用开发>定义预处理”页面,单击“选择预处理逻辑”的自动旋转,快速处理当前模板的方向。
也可以按左上角操作指标手动调整图片。详情请见定义预处理。
图8 定义预处理
- 在页面上方通过调整成第二个模板,对第二个模板进行预处理。
图9 定义预处理
- 所有模板均完成预处理后,单击右下角的“下一步”。
进入“应用开发>框选参照字段”页面。
步骤5:框选参照字段
- 在“应用开发>框选参照字段”页面,通过单击左上方操作图标,调整当前模板图片到合适大小。
- 单击框选操作图标,单击参照字段左上角,移动鼠标,使得矩形框覆盖参照字段。
- 参照字段是文字内容、位置固定不变的文本框区域。
- 建议选取图片中不会重复出现的文字作为参照字段,否则影响模板匹配效果。
- 参照字段为单行文本框,不可以框选竖版文字或跨行框选。
- 框选参照字段个数须不少于4个,并尽量分散在图片的四周。
- 参考字段尽量框选独立文本块,避免框选某一个文本块的一部分,有利于识别精度提升。
本样例框选的参照字段如图10所示。
- 页面上方通过调整成第二个模板,弹出“保存操作”对话框,单击“确认”。
- 对第二个模板框选参照字段。
本样例框选的参照字段如图11所示。
- 所有模板都框选完参照字段后,单击右下角的“下一步”。
进入“应用开发>框选识别区”页面。
步骤6:框选识别区
- 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整当前模板图片到合适大小。
- 单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。
识别区是对应字段内容所在区域。在框选时,建议尽量扩大识别区的框选范围使其覆盖对应字段内容可能出现的区域,防止在不同图片识别时出现漏字。
本样例框选的识别区如图12所示。
- 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。
本样例的框选字段可按框选内容自己定义,字段类型均可选择“常规”。
如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
- 页面上方通过调整成第二个模板,弹出“保存操作”对话框,单击“确认”。
- 对第二个模板框选识别区,并在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。。
本样例框选的识别区如图13所示。
本样例的框选字段可按框选内容自己定义,字段类型均可选择“常规”。
如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
- 框选并核对完所有模板识别区后,单击“下一步”,在提示框中单击“确认”。
进入“应用开发>上传训练集”页面。
步骤7:上传训练集
- 在“应用开发>上传训练集”页面,选择模板,单击操作列的“上传训练集”。
弹出上传文件对话框。
- 单击上传文件对话框,在本地选择已经准备好的模板“zip”包文件。
上传成功后页面右上方会提示“文件上传成功”。
- 确定每个模板上传训练集后,单击“开始训练”。
服务进入“应用开发>评估”页面,开始训练模型。
模型训练完成后,可在“应用开发>评估”页面评估分类器和模板,详情请见步骤8:评估模板。