更新时间:2023-01-31 GMT+08:00
分享

框选参照字段

在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。

为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。

基本概念

参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。

套件提供了自动搜索参照字段和手动框选参照字段这两种模式。

  • 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。
  • 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。

当识别图片的场景比较单一时,即只有一种模板,且参照字段不容易与其他文字混淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤

前提条件

已在文字识别套件控制台选择“通用单模板工作流”新建应用,并对上传的模板图片进行预处理,详情请见定义预处理

操作步骤

图1 框选参照字段
  1. “应用开发>框选参照字段”页面,通过单击左上方操作图标,调整模板图片到合适大小。
  2. 单击框选操作图标,单击参照字段左上角,移动鼠标,使得矩形框覆盖参照字段。
    • 参照字段是文字内容、位置固定不变的文本框区域。
    • 参照字段为单行文本框,不可以框选竖版文字或跨行框选。
    • 框选参照字段个数须建议大于4个,越多越好,并尽量分散在图片的四周。

    • 参考字段尽量沿着文字边缘框选,精确框住对应文本行为佳。
  3. 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。
  4. 框选并核对完所有参照字段后,单击“下一步”,进入框选识别区步骤。

相关文档