使用单模板工作流开发应用
ModelArts Pro的文字识别套件提供了通用单模板工作流,通过工作流指引可构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。
本章节提供一个身份证样例,帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识别区,自动训练并生成文字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务识别身份证模板中的文字。
首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用通用单模板工作流开发应用的步骤如下所示:
步骤1:准备数据
在本地准备好两张身份证图片,一张用于制作模板,一张用于评估模板。图片要求如下:
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在100px到4096px之间。
- 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
- 支持图像任意角度的水平旋转。
- 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。
步骤2:新建应用
- 登录ModelArts Pro控制台,单击“文字识别”套件卡片的“进入套件”。
默认进入“应用开发>工作台”页面的“我的应用”页签。
图1 进入套件
- 在“我的应用”页签下,单击“新建应用”。
进入“新建应用”页面。
图2 新建应用
- 根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。
本样例“工作流”选择“通用单模板工作流”。
图3 新建应用
- 确认信息后,单击右下角的“确定”。
成功新建应用,进入“应用资产”页面。
步骤3:上传模板图片
- 在“应用资产”页面单击模板列表下方的“创建模板”。
进入“应用开发>上传模板图片”页面。
图4 创建模板
- 输入“模板名称”,并选择“模板类型”。
本样例“模板类型”选择“票证”。
- 单击“上传图片”区域,上传提前在本地准备好的一张身份证图片作为模板。
图5 上传模板图片
- 单击右下角的“下一步”。
进入“应用开发>定义预处理”页面。
步骤4:定义预处理
- 在“应用开发>定义预处理”页面,单击“选择预处理逻辑”的自动旋转,快速处理图片的方向。
也可以按左上角操作指标手动调整图片。详情请见定义预处理。
图6 定义预处理
- 单击右下角的“下一步”。
进入“应用开发>框选参照字段”页面。
图7 框选参照字段
步骤5:框选参照字段
- 在“应用开发>框选参照字段”页面,通过单击左上方操作图标,调整模板图片到合适大小。
- 单击框选操作图标,单击参照字段左上角,移动鼠标,使得矩形框覆盖参照字段。
- 参照字段是文字内容、位置固定不变的文本框区域。
- 建议选取图片中不会重复出现的文字作为参照字段,否则影响模板匹配效果。
- 参照字段为单行文本框,不可以框选竖版文字或跨行框选。
- 框选参照字段个数须不少于4个,并尽量分散在图片的四周。
- 参考字段尽量框选独立文本块,避免框选某一个文本块的一部分,有利于识别精度提升。
本样例框选的参照字段如图8所示。
- 单击右下角的“下一步”。
进入“应用开发>框选识别区”页面。
图9 框选识别区页面
步骤6:框选识别区
- 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整模板图片到合适大小。
- 单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。
识别区是对应字段内容所在区域。在框选时,建议尽量扩大识别区的框选范围使其覆盖对应字段内容可能出现的区域,防止在不同图片识别时出现漏字。
本样例框选的识别区如图10所示。
- 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。
本样例的框选字段可按框选内容自己定义,字段类型均可选择“常规”。
如果“默认字段类型”不能满足您的业务需求,您可以在字段类型下拉框单击“创建新字段类型”,创建新字段类型。
图11 选择字段类型
- 框选并核对完所有识别区后,单击“下一步”。
进入“应用开发>评估”页面。
图12 评估页面