更新时间:2024-05-22 GMT+08:00
分享

上传模板图片

在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。

前提条件

  • 已在自定义OCR控制台选择“多模板分类工作流”创建应用,详情请见创建应用
  • 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求

数据要求

  • 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
  • 图片最大边不大于4096px,最小边不小于100px,且大小不超过5M。
  • 图片中的文字清晰可认。

进入应用开发页面

  1. 登录“文字识别>自定义OCR”控制台。

    默认进入“应用开发>工作台”页面。

  2. “我的应用”页签下,选择应用并单击“操作”列的“查看”

    进入“应用资产”页面。

    图1 进入应用资产
  3. 单击“创建分类器”

    进入“应用开发”页面,开始开发应用。

    图2 创建分类器

填写基本信息

“应用开发>上传模板图片”页面,输入多模板分类器的“名称”“描述”

图3 上传模板图片

然后上传模板图片,可选择新增模板配置。

新增模板配置

默认进入“新增模板配置”页签。

图4 新增模板配置

单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。

“上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。

“修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”

“删除模板”:单击图片右侧“删除”,在弹出的确认删除对话框中单击“确认”

“语种”:单击图片右侧“语种”下拉选择框,选择模板对应的语种。不选择的情况下,默认为中英文。

确认信息后,单击“下一步”,进入定义预处理步骤,对上传的模板图片进行自动旋转、裁剪等预处理。

相关文档