更新时间:2023-01-31 GMT+08:00
分享

上传模板图片

在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。

前提条件

  • 已授权ModelArts服务和对象存储服务(OBS)。
  • 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用
  • 提前准备模板图片以及训练分类器的数据集,其要求请见数据要求

数据要求

  • 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
  • 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。
  • 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。

进入应用开发页面

  1. 登录“ModelArts Pro>文字识别套件”控制台。

    默认进入“应用开发>工作台”页面。

  2. “我的应用”页签下,选择应用并单击“操作”列的“查看”

    进入“应用资产”页面。

    图1 进入应用资产
  3. 单击“创建分类器”

    进入“应用开发”页面,开始开发应用。

    图2 创建分类器

填写基本信息

“应用开发>上传模板图片”页面,输入多模板分类器的“名称”“描述”

图3 上传模板图片

然后上传模板图片,可选择新增模板配置,也可直接添加已有的模板配置。

新增模板配置

默认进入“新增模板配置”页签。

图4 新增模板配置

单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。

“上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。

“修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”

“删除模板”:单击图片右侧“删除”,在弹出的确认删除对话框中单击“确认”

确认信息后,单击“下一步”,进入定义预处理步骤,对上传的模板图片进行自动旋转、去印章等预处理。

添加已有模板

  1. 单击“添加已有模板”,进入“添加已有模板”页签。
  2. 单击“添加已有模板”,弹出“添加已有模板”对话框。

    对话框中仅显示已发布的模板。

    图5 添加已有模板
  3. 在对话框中勾选已有模板,单击“确定”
    图6 添加已有模板

相关文档