ocr怎么识别截图文字_智能文档解析-华为云

智能文档解析

图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过80%，保证所有文字及其边缘包含在图像内。支持图像任意角度的水平旋转。单页字符数不大于1800，以获得较优的识别效果。目前不支持复杂背景（如户外自然场景、防伪水印等）和文字扭曲图像的文档解析。文字识别服务属于公有云服务，线上用

来自：帮助中心

查看更多 →
视频截图

视频截图功能介绍视频截图接口约束 URI /openapi/v1/rtcLive/captureImage 请求参数接口字段字段类型是否必填说明备注 channelId String 频道ID 三方自行生成，字符串类型，1~64位，由大小写字母、数字、下划线（_）

来自：帮助中心

查看更多 →
OCR服务提供哪些版本的SDK

OCR服务提供哪些版本的SDK 目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册，该手册详细介绍了SDK支持的版本及使用方法。如果想用其他编程语言调用OCR API服务，可以使用Toke

来自：帮助中心

查看更多 →
OCR服务使用简介

OCR服务使用简介文字识别（Optical Character Recognition，简称OCR）指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API（Application Programming Interface，应用程序

来自：帮助中心

查看更多 →
通用表格识别

WordsRegionList 参数参数类型描述 type String 文字识别区域类型。 text：文本识别区域; table：表格识别区域。 words_block_count Integer 子区域识别文字块数目。 words_block_list Array of Gene

来自：帮助中心

查看更多 →
附录

靠的方式运行。此外，按函数实际执行资源计费，不执行不产生费用。文字识别 OCR：提供在线文字识别服务，将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。

来自：帮助中心

查看更多 →
最新动态

车辆通行费发票识别：识别车辆通行费中的关键文字信息，并返回识别的结构化结果。飞机行程单识别：识别飞机行程单中的文字信息，并返回识别的结构化结果。定额发票识别：识别定额发票中的文字信息，并返回识别的结构化结果。商用 - 2 新增火车票识别、银行卡识别、营业执照识别火车票识别：识别火车票中的文字信息，并返回识别的结构化结果。

来自：帮助中心

查看更多 →
入门实践

当您完成了调用API、调用SDK基本操作后，可以根据自身的业务需求使用OCR提供的入门实践。表1 常用最佳实践实践描述发票识别与验真该实践基于华为云文字识别服务增值税发票识别与发票验真技术构建，自动识别和录入增值税发票各字段信息，减少人工核算工作量，实现财税报销自动化。同

来自：帮助中心

查看更多 →
OCR

符，长度为1～128个字符。图片路径是需要识别的图片在OBS上的路径。识别类型是可识别的图片类型, 当前仅支持通用文字识别。可支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。识别结果存储目录是指定识别结果存储的OBS目录。表2 高级参数参数是否必选

来自：帮助中心

查看更多 →
附录

费，不执行不产生费用。文字识别 OCR：提供在线文字识别服务，将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。人证核身服务 IVS：将用户本人与身份证信息关联起来，应用人脸识别与文字识别等技术，对接权威数据库，

来自：帮助中心

查看更多 →
财务报表识别

财务报表识别功能介绍识别用户上传的表格图片中的文字内容，并将识别的结果返回给用户。约束与限制只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。图像各边的像素大小在15px到8192px之间。图像中识别区域有效占比超过80%，保证整张表格及其边缘包含在图像内。

来自：帮助中心

查看更多 →
调用SDK实现通用表格识别

调用SDK实现通用表格识别文字识别服务软件开发工具包（OCR SDK）是对文字识别服务提供的REST API进行的封装，以简化用户的开发工作。本章节以通用表格识别API为例，介绍如何使用OCR Python SDK。使用OCR SDK的详细步骤如下所示：步骤1：开通服务步骤2：安装SDK

来自：帮助中心

查看更多 →
OCR服务可以识别文本格式文件吗

OCR服务可以识别文本格式文件吗增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件，可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。父主题：产品咨询类

来自：帮助中心

查看更多 →
驾驶证识别

驾驶证识别功能介绍识别驾驶证图片中主页与副页的文字内容，并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 驾驶证示例图图2 电子驾驶证示例图如果图片中包含多张卡证票据，请调用智能分类识别服务。约束与限制

来自：帮助中心

查看更多 →
银行卡识别

银行卡识别功能介绍识别银行卡上的关键文字信息，并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 银行卡示例图如果图片中包含多张卡证票据，请调用智能分类识别服务。约束与限制只支持识别JPG、JPEG、PNG、BMP、TIFF格式图片。

来自：帮助中心

查看更多 →
车辆通行费发票识别

车辆通行费发票识别功能介绍识别车辆通行费发票中的关键文字信息，并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制，详细使用指导请参见OCR服务使用简介章节。图1 车辆通行费发票示例图如果图片中包含多张卡证票据，请调用智能分类识别服务。约束与限制支持

来自：帮助中心

查看更多 →
常见问题

常见问题什么情况下可以使用自定义模板？如何选取参照字段？识别结果容易漏字或多识别出内容怎么办？识别字符出现错误如何优化？自定义模板OCR取消开通后，是否会将之前创建好的模板删除？父主题：自定义OCR

来自：帮助中心

查看更多 →
字段类型

字段类型在“框选识别区”页面，可以给每个字段指定字段类型来提高识别准确率，或是将文字识别结果处理成业务需要的格式。勾选字段类型后，后台会对文字识别结果进行相应的处理后再输出。每个识别区可选择多个字段类型，多个字段类型会按照勾选顺序执行。自定义OCR控制台提供了默认字段类型和自定义字段类型两种功能。

来自：帮助中心

查看更多 →
修订记录

车辆通行费发票识别飞机行程单识别定额发票识别火车票识别银行卡识别营业执照识别护照识别道路运输证识别网络图片识别出租车发票识别 2019-07-01 优化错误码章节。 2019-05-29 优化使用前必读如何调用API 2019-02-02 将文字识别对应“endpoint”修改为“ocr

来自：帮助中心

查看更多 →
已关闭OCR服务，为什么会出现额外的计费或欠费

明细账单”查看资源的费用账单，并找到对应的计费产品/规格（如：通用文字识别）、区域（如：华北-北京四）等信息。图1 明细账单进入文字识别控制台，按照查询到的计费产品/规格和区域进入到对应的购买界面（如：华北-北京四的通用文字识别），单击开通管理，查询到依然处于开通状态的用户，并单击“取消服务”即可。

来自：帮助中心

查看更多 →
银行回单识别

支持同时返回单张图像中存在的多张回单识别结果。图像中key值对应的value值为空时，不会返回对应的键值对。目前不支持复杂背景（如户外自然场景、防伪水印等）和文字扭曲图像的文字识别。文字识别服务属于公有云服务，线上用户资源共享，如果需要多并发请求，请提前联系我们。调用方法请参见如何调用API。

来自：帮助中心

查看更多 →