更新时间:2023-01-31 GMT+08:00
分享

工作流介绍

工作流简介

  • 功能介绍

    支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。

  • 适用场景
    • 用户认证识别

      识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。

    • 快递单自动填写

      识别图片中联系人信息并自动填写快递单,减少人工输入。

    • 合同录入与审核

      自动提取合同结构化信息,有助快速审核。

  • 优势
    • 解决手工录入投入大、效率低、语种多等问题,提升业务效率。
    • 一键式部署,快速输出高精度结构化数据。
    • 解决单据复杂、单据板式多、语种多问题,支持自定义多个图像板式,快速适配新板式,快速接入业务。
    • 支持从多个不同板式图像中提取结构化信息。

工作流流程

“ModelArts Pro>文字识别套件”控制台选择“多模板分类工作流”新建应用,详细操作请见新建应用。您可以创建多模板服务,通过多模板训练模板分类模型和文字识别模型,实现多模板图像的文字信息结构化提取

图1 创建多模板流程
表1 创建多模板流程说明

流程

说明

详细指导

上传模板图片

在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。

上传模板图片

定义预处理

上传模板图片后,需要对模板图片进行预处理,保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。

定义预处理

框选参照字段

在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中的结构化信息

框选参照字段

框选识别区

在图片模板中框选识别区,确定模板图片中需要识别的文字位置。

框选识别区

训练分类器

多模板分类工作流可以通过追加训练分类器,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。

训练分类器

评估应用

通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。

评估应用

部署服务

模板图片评估后,可以部署模板至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的多模板样式的图片。

部署服务

相关文档