上传模板图片
在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。
前提条件
数据要求
- 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
- 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。
- 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。
进入应用开发页面
- 登录“ModelArts Pro>文字识别套件”控制台。
默认进入“应用开发>工作台”页面。
- 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
进入“应用资产”页面。
图1 进入应用资产
- 单击“创建分类器”。
进入“应用开发”页面,开始开发应用。
图2 创建分类器
填写基本信息
在“应用开发>上传模板图片”页面,输入多模板分类器的“名称”和“描述”。
然后上传模板图片,可选择新增模板配置,也可直接添加已有的模板配置。
- 新增模板配置
- 添加已有模板
新增模板配置
默认进入“新增模板配置”页签。
单击添加多个模板,针对每个模板,选择模板类型,并且上传图片。
“上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。
“修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”。
“删除模板”:单击图片右侧“删除”,在弹出的确认删除对话框中单击“确认”。
确认信息后,单击“下一步”,进入定义预处理步骤,对上传的模板图片进行自动旋转、去印章等预处理。
添加已有模板
- 单击“添加已有模板”,进入“添加已有模板”页签。
- 单击“添加已有模板”,弹出“添加已有模板”对话框。
对话框中仅显示已发布的模板。
图5 添加已有模板
- 在对话框中勾选已有模板,单击“确定”。
图6 添加已有模板