更新时间:2024-05-22 GMT+08:00
分享

框选参照字段

在识别文字的过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。

为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种模板,最后通过参照字段的位置来校正待识别图片。

基本概念

参照字段为模板图片和待识别图片中的公共文字部分,所有需要识别的图片中都要包含参照字段,且位置必须固定。

套件提供了自动搜索参照字段和手动框选参照字段这两种模式。

  • 自动搜索参照字段:未手动框选任何参照字段的情况下,默认激活自动搜索参照字段模式。
  • 手动框选参照字段:若手动框选了任意参照字段,将激活手动框选模式。

当识别图片的场景比较单一时,即只有一种模板,且参照字段不容易与其他文字混淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤

前提条件

已在自定义OCR控制台选择“多模板分类工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理

操作步骤

图1 多模板框选参照字段
  1. “应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。
  2. 单击左上方操作图标,调整当前模板图片到合适大小和位置。
  3. 单击框选操作图标,单击参照字段左上角,移动鼠标,使得矩形框覆盖参照字段。
    • 参照字段是文字内容、位置固定不变的文本框区域。
    • 参照字段为单行文本框,不可以框选竖版文字或跨行框选。
    • 框选参照字段个数须建议大于4个,越多越好,并尽量分散在图片的四周。

    • 参考字段尽量沿着文字边缘框选,精确框住对应文本行为佳。
  4. 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。
  5. 框选并核对完所有模板图片的参照字段后,单击“下一步”,进入框选识别区步骤。

相关文档