华为云开发者中心为开发者提供所有云服务的API及API手册、各产品的SDK、可服务的节点区域和各服务的终端节点EndPoint和在使用华为云产品时需要用到的CLI工具、业务工具等的下载及使用说明。

 
 

 

    识别图片上文字的接口 更多内容
  • 约束与限制

    支持单图多印章识别。 支持图像中印章任意角度水平旋转。 支持圆形章、椭圆章、方形章、三角章和菱形章检测和识别。 能处理反光、暗光等干扰图片但影响识别精度。 身份证识别 支持中华人民共和国居民身份证识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15到8192px之间。

    来自:帮助中心

    查看更多 →

  • 框选参照字段

    框选参照字段个数须建议大于4个,越多越好,并尽量分散在图片四周。 参考字段尽量沿着文字边缘框选,精确框住对应文本行为佳。 核对右侧“框选参照字段”中参照字段是否与框选参照字段一致。 框选并核对完所有模板图片参照字段后,单击“下一步”,进入框选识别区步骤。 父主题: 多模板分类工作流

    来自:帮助中心

    查看更多 →

  • OCR服务使用简介

    OCR服务使用简介 文字识别(Optical Character Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中打印字符进行检测识别成可编辑文本格式。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方

    来自:帮助中心

    查看更多 →

  • 框选识别区

    框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现区域。 在右侧“框选识别区”中填写“框选字段”,选择“字段类型”。 “字段类型”指待识别文字内容,您可以在默认字段类型中选择,当前可选择默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数字和英文”、“编号”、“性别”,每个识别区可选择多个字段类型。

    来自:帮助中心

    查看更多 →

  • 框选参照字段

    框选参照字段个数须建议大于4个,越多越好,并尽量分散在图片四周。 参考字段尽量沿着文字边缘框选,精确框住对应文本行为佳。 核对右侧“框选参照字段”中参照字段是否与框选参照字段一致。 框选并核对完所有模板图片参照字段后,单击“下一步”,进入框选识别区步骤。 父主题: 多模板分类工作流

    来自:帮助中心

    查看更多 →

  • 票据类

    票据类 功能介绍 增值税发票识别 通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票文字信息识别出来,用于后续进一步处理,节省大量的人工录入成本。 机动车销售发票识别 自动识别机动车销售发票图片文本内容,并返回结构化字

    来自:帮助中心

    查看更多 →

  • 证件类

    自动识别图片中车牌信息。 名片识别 自动识别名片中信息,识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息,并将识别结果返回给用户。 VIN码识别 自动识别图片车架号信息。 泰文身份证识别 自动识别身份证全部信息,一次扫描即可识别身份证号码、姓名、地址等全部信息。

    来自:帮助中心

    查看更多 →

  • 自定义OCR介绍

    作流,自主构建文字识别模板,识别模板图片文字,提供高精度文字识别模型,保证结构化信息提取精度。 通用单模板工作流 通过构建文字识别模板,识别单个板式图片文字,提供高精度文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过AI分

    来自:帮助中心

    查看更多 →

  • 通用表格识别

    单字符置信度,置信度越大,表示本次识别文字可靠性越高,在统计意义,置信度越大,准确率越高。置信度由算法给出,不直接等价于对应字段准确率。 char_location Array<Array<Integer>> 单字符位置信息,列表形式,分别表示文字块4个顶点x, y

    来自:帮助中心

    查看更多 →

  • 框选识别区

    找出与待识别文字最相似的取值,作为识别结果。 自定义正则提取 预过滤 对初始识别文字进行预处理。 左边输入框填写待识别文字中被替换字符正则表达式。 右边输入框填写所替换新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增预处理规则。 例如: “字段类型名称”:“出生日期”

    来自:帮助中心

    查看更多 →

  • 框选识别区

    框选识别区 在文字识别过程中,需要确定图片识别文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别文字位置。所有需要识别图片中都会包含此识别字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容位置。 前提条件 已在自定义OCR控制台选择“通用单模

    来自:帮助中心

    查看更多 →

  • 框选参照字段

    框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别图片,这就需要在模板图片中指定参照字段。通过参照字段文字内容来判断是否属于同一种模板,通过参照字段位置来校正待识别图片。

    来自:帮助中心

    查看更多 →

  • API是否可以混用

    API是否可以混用 不建议混用,例如有专门身份证识别,就不建议使用“通用文字识别识别身份证图片,不同接口底层算法不同,混用会导致识别效果差。 父主题: API使用类

    来自:帮助中心

    查看更多 →

  • 部署服务

    部署服务 评估模板应用后,就可以部署多模板应用至文字识别开发套件中,开发属于自己文字识别应用,此应用用于识别自己所上传图片属于哪种模板以及识别图片文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在

    来自:帮助中心

    查看更多 →

  • 驾驶证识别

    携带正确的ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。 表3 请求Body参数

    来自:帮助中心

    查看更多 →

  • 框选识别区

    'an”中找出与待识别文字最相似的取值,作为识别结果。 自定义正则提取 预过滤 对初始识别文字进行预处理。 左边输入框填写待识别文字中被替换字符正则表达式。 右边输入框填写所替换新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增预处理规则。 例如:

    来自:帮助中心

    查看更多 →

  • 如何提高识别精度

    如何提高识别精度 尽量使用文字清晰度高、无反光图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平

    来自:帮助中心

    查看更多 →

  • 如何提高识别速度

    如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程时间,因此建议在图片文字清晰情况下,适当压缩图片大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类小图(文字少)在1M以下,A4纸大小密集文档大图在2M以下。

    来自:帮助中心

    查看更多 →

  • 银行卡识别

    携带正确的ID,正常使用OCR服务,账单企业项目会被分类到企业ID对应企业项目中。 携带格式正确但不存在ID,正常使用OCR服务,账单企业项目会显示对应不存在企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单企业项目会被分类到"default"中。 表3 请求Body参数

    来自:帮助中心

    查看更多 →

  • 如何选取参照字段?

    如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段内容和位置将作为相应模板分类特征。 在框选参照字段时,首先要确保所框选文字位置和内容都固定不变,如果不

    来自:帮助中心

    查看更多 →

  • 车辆通行费发票识别

    Object 字段置信度,取值范围0~1。 置信度越大,本次识别的字段可靠性越高,在统计意义,置信度越大,准确率越高。 置信度由算法给出,不直接等价于字段准确率。 text_location Object 对应所有在原图识别字段位置信息,包含所有文字区域四个顶点二维坐标(x

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了