文档首页> 文字识别 OCR> 用户指南> 自定义OCR> 常见问题> 什么情况下可以使用自定义模板?
更新时间:2023-08-11 GMT+08:00
分享

什么情况下可以使用自定义模板?

自定义模板是一款用于提取卡证、票据和文档图片中自定义区域信息的文字识别产品。当您要识别的证件或票据种类不在华为云OCR API支持之中,并且识别图片的版式固定,则可以使用本产品提取自定义版式、自定义区域的文字信息。比如,目前华为云尚未推出毕业证书识别API,则可以利用自定义模板打造出毕业证书识别接口,提取毕业证上的文字信息。

自定义模板支持识别单模板应用或是多模板应用,单模板仅支持一种版式,多模板支持识别多种版式。

单模板的前提:

  • 识别图片需与模板图片版式相同,具体而言,图片中要存在文字内容和位置均固定不变的文字(参照字段)。
  • 识别文字内容不能偏离设定的识别区域,包括打印偏移、由上下文长度变化引起的偏移等。

多模板的前提:

  • 分类器中的任一模板,均需满足上述单模板的要求。
  • 模板种类固定,识别不在多模板中的图片可能会返回错误的结果或无法识别。
  • 模板间有足够的区分度,不同模板要有不同的参照字段,且参照字段差异尽量明显,相似的参照字段容易导致分类错误。
  • 模板数量可穷举,建议不超过20种模板,过多的模板会降低分类效果(以实际测试为准,模板差异较大时允许支持更多模板)。
分享:

    相关文档

    相关产品