框选参照字段
在识别文字的过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。
为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种模板,最后通过参照字段的位置来校正待识别图片。
基本概念
参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。
套件提供了自动搜索参照字段和手动框选参照字段这两种模式。
- 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。
- 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。
当识别图片的场景比较单一时,即只有一种模板,且参照字段不容易与其他文字混淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。
前提条件
已在自定义OCR控制台选择“多模板分类工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理。
操作步骤
- 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。
- 单击左上方操作图标,调整当前模板图片到合适大小和位置。
- 单击框选操作图标,单击参照字段左上角,移动鼠标,使得矩形框覆盖参照字段。
- 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。
- 框选并核对完所有模板图片的参照字段后,单击“下一步”,进入框选识别区步骤。