更新时间:2024-05-22 GMT+08:00
分享

工作流介绍

工作流简介

  • 功能介绍

    支持用户自定义多个文字识别模板,通过模型分类,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。

  • 适用场景
    • 用户认证识别

      识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。

    • 快递单自动填写

      识别图片中联系人信息并自动填写快递单,减少人工输入。

    • 合同录入与审核

      自动提取合同结构化信息,有助快速审核。

  • 优势
    • 解决手工录入投入大、效率低、语种多等问题,提升业务效率。
    • 一键式部署,快速输出高精度结构化数据。
    • 解决单据复杂、单据板式多、语种多问题,支持自定义多个图像板式,快速适配新板式,快速接入业务。
    • 支持从多个不同板式图像中提取结构化信息。

工作流流程

“文字识别>自定义OCR”控制台选择“多模板分类工作流”创建应用,详细操作请见创建应用。您可以创建多模板服务,通过多模板训练模板分类模型和文字识别模型,实现多模板图像的文字信息结构化提取。

图1 创建多模板流程
表1 创建多模板流程说明

流程

说明

详细指导

上传模板图片

在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。

上传模板图片

定义预处理

上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。

定义预处理

框选参照字段

在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息。对于多模板应用而言,参照字段还将用于区分不同的模板。

框选参照字段

框选识别区

在图片模板中框选识别区,确定模板图片中需要识别的文字位置。

框选识别区

模板总览

检查所有模板是否已正确配置。

模板总览

评估

通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。

评估

相关文档