更新时间:2024-07-01 GMT+08:00
约束与限制
受技术与成本多种因素制约,文字识别服务存在一些约束限制。其中系统级约束限制,是所有子服务的约束。除系统级约束限制外,各子服务还有独立的约束条件。
智能文档解析
- 支持中英文及部分中文繁体字。
- 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片以及PDF文档,PDF只支持单页识别,可通过pdf_page_number参数指定页码。
- 图像各边的像素大小在15px到8192px之间。
- 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
- 支持图像任意角度的水平旋转。
- 单页字符数不大于1800,以获得较优的识别效果。
- 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文档解析。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
通用表格识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15px到8192px之间。
- 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
- 支持图像任意角度的水平旋转。
- 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。
- 支持中英文以及部分繁体字。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
通用文字识别
- 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片。
- 图像各边的像素大小在15px到8192px之间。
- 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
- 支持图像任意角度的水平旋转。
- 支持自动过滤浅色文字水印。
- 目前不支持复杂背景(如户外自然场景等)和文字扭曲图像的文字识别。
- 支持中英文以及部分繁体字、马来语、乌克兰语、印地语、俄语、越南语、印尼语、泰语、阿拉伯语、德语、拉丁语、法语、意大利语、西班牙语、葡萄牙语、罗马尼亚语、波兰语、阿姆哈拉语、日语、韩语、土耳其语、挪威语、丹麦语、瑞典语、柬埔寨语识别。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
网络图片识别
- 支持中英文及部分中文繁体字。
- 只支持识别JPG、JPEG、PNG、BMP、TIFF、TGA、WEBP、ICO、PCX、GIF格式图片。
- 支持常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片。
- 图像各边的像素大小在15到8192px之间。
- 图像中有效文字图片占比超过60%,避免有效文字图片占比过小。
- 支持图像中有效文字图片的任意角度的水平旋转(需开启方向检测)。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
智能分类识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF、PDF格式数据。
- 图像各边的像素大小在15px到8000px之间。
- 支持图像中票证任意角度的水平旋转。
- PDF格式数据使用第一页作智能分类。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
手写文字识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
- 支持图像任意角度的水平旋转(需开启方向检测)。
- 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
印章识别
- 支持JPEG、JPG、PNG、BMP、TIFF、PDF格式,多页PDF默认识别第一页,或者您可以指定要识别的页码。
- 图像各边的像素大小在15px到8192px之间。
- 支持单图多印章识别。
- 支持图像中印章任意角度的水平旋转。
- 支持圆形章、椭圆章、方形章、三角章和菱形章的检测和识别。
- 能处理反光、暗光等干扰的图片但影响识别精度。
身份证识别
- 支持中华人民共和国居民身份证的识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8000px之间。
- 图像中身份证区域有效占比超过25%,保证整张身份证内容及其边缘包含在图像内。
- 支持图像中身份证任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的身份证长宽比与实际身份证相差不超过10%。
- 能处理反光、暗光等干扰的图片但影响识别精度。
- 目前支持识别单张身份证的正面或者反面。
- 支持居民身份证的正反面同时识别,不支持存在两张及以上同面身份证的图片识别。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
户口本识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素在15到8192px之间。
- 支持多页同时识别。
- 能处理反光、暗光、水印等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
驾驶证识别
- 只支持中国大陆驾驶证纸质版本及交管12123提供的电子驾驶证版本识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在100到8000px之间。
- 图像中驾驶证区域有效占比超过50%,保证整张驾驶证内容及其边缘包含在图像内。
- 支持图像中驾驶证任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的驾驶证长宽比与实际驾驶证相差不超过10%。
- 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
行驶证识别
- 只支持中国大陆行驶证的识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在100到8000px之间。
- 图像中行驶证区域有效占比超过5%,保证整张行驶证内容及其边缘包含在图像内。
- 支持图像中行驶证任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的行驶证长宽比与实际行驶证相差不超过10%。
- 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。
- 目前只支持识别2008年版的行驶证。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
护照识别
- 支持中国大陆护照的全字段识别。
- 支持含有完整机读码的中国-港澳台地区及外国护照识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 图像中护照首页区域有效占比超过25%,保证护照首页内容及其边缘包含在图像内。
- 支持图像中护照任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的护照长宽比与实际护照相差不超过10%。
- 能处理反光、暗光等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
银行卡识别
- 只支持识别JPG、JPEG、PNG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 只支持识别银行卡正面,不支持识别背面。
- 只支持识别85.60×53.98 mm常规大小的银行卡,不支持迷你卡和形状不规则的异形卡。
- 支持图像中银行卡任意角度的水平旋转。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
营业执照识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片及PDF。
- 图像各边的像素在15到8192px之间。
- 图像中营业执照区域有效占比超过70%,保证整张营业执照及其边缘包含在图像内。
- 支持图像中营业执照旋转、支持少量扭曲。
- 能处理暗光等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
道路运输证识别
- 只支持中国大陆道路运输证的识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到4096px之间。
- 支持图像中道路运输证任意角度的水平旋转。
- 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
车牌识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到4096px之间。
- 图像中车牌区域有效占比超过10%,保证所有文字及其边缘包含在图像内。
- 推荐图像中车牌清晰无遮挡、正面放置无倾斜。
- 目前支持车牌类型含小型汽车、小型新能源、大型新能源、使馆汽车、领馆汽车、中国-港澳入出境汽车、教练汽车、警用汽车号牌,支持双行号牌。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
名片识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 图像中名片的有效占比超过60%,保证整张名片内容包含在图像内。
- 支持图像中名片的任意角度的水平旋转(需开启方向检测)。
- 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
VIN码识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到4096px之间。
- 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
道路运输从业资格证识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15px到8192px之间。
- 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
- 支持图像任意角度的水平旋转。
- 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
不动产证
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 支持图像中不动产证任意角度的水平旋转。
- 能处理反光、暗光等干扰的图片但影响识别精度。
车辆合格证
- 只支持中国大陆车辆合格证的识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 图像中识别区域有效占比超过80%,保证整张车辆合格证内容及其边缘包含在图像内。
- 支持图像中车辆合格证任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的车辆合格证长宽比与实际驾驶证相差不超过10%。
- 能处理暗光等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
哥伦比亚身份证
- 支持哥伦比亚身份证的识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
- 图像各边的像素大小在15px到8000px之间。
- 图像中身份证区域有效占比超过80%,保证整张身份证内容及其边缘包含在图像内。
- 支持图像中身份证任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的身份证长宽比与实际身份证相差不超过10%。
- 能处理反光、暗光等干扰的图片但影响识别精度。
- 目前只支持识别单张身份证的正面或者反面。
增值税发票识别
- 支持JPEG、JPG、PNG、BMP、TIFF、PDF、OFD格式,多页PDF默认识别第一页,或者您可以指定要识别的页码。
- 图像各边的像素大小在100到8192px之间。
- 图像中发票区域有效占比超过80%。
- 支持图像中增值税发票任意角度的水平旋转。
- 图片中发票宽高比例与真实发票比例一致。
- 目前只支持中华人民共和国境内的增值税发票识别。
- 支持增值税专用发票、全电发票(不含行业类发票)和增值税普通发票(含电子普通发票),包括增值税普通发票中的卷式发票、通行费发票。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
发票验真
- 支持增值税专用发票、增值税普通发票、增值税普通发票(卷式)、增值税电子专用发票、增值税电子普通发票、增值税电子普通发票(通行费)、二手车销售统一发票、机动车销售统一发票、区块链电子发票和全电发票,共计10种发票信息核验。
- 每份发票每天最多可查验5次。可查验最近5年内(国家税务总局)增值税发票管理系统开具的发票。
- 税务局数据同步有时延,建议当天新开的发票在24小时后查询。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
机动车销售发票识别
- 支持识别PNG、JPG、JPEG、BMP、TIFF、PDF格式。
- 图像各边的像素大小在100到8000px之间。
- 图像中识别区域有效占比超过80%,保证整张发票及其边缘包含在图像内。
- 支持图像中发票任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的发票长宽比与实际发票相差不超过10%。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
出租车发票识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到4096px之间。
- 图像中发票区域有效占比超过25%,保证整张发票内容及其边缘包含在图像内。
- 支持少量扭曲,扭曲后图像中的发票长宽比与实际发票相差不超过10%。
- 支持图像中出租车发票任意角度的水平旋转。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
车辆通行费发票识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到4096px之间。
- 图像中发票区域有效占比超过25%。
- 支持图像中车辆通行费发票任意角度的水平旋转。
- 目前只支持中华人民共和国境内的车辆通行费发票识别。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
飞机行程单识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 支持图像中行程单任意角度的水平旋转。
- 能处理反光、暗光等干扰的图片但影响识别精度。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
定额发票识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到4096px之间。
- 图像中发票区域有效占比超过25%。
- 支持图像中发票任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的发票长宽比与实际发票相差不超过10%。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
火车票识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 图像中火车票区域有效占比超过25%。
- 支持图像中火车票任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的火车票长宽比与实际火车票相差不超过10%。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
电子面单识别
- 电子面单支持的版式以样例为准。
- 支持识别JPG、PNG、BMP、TIFF格式图片。
- 图像各边的像素大小在15px到8192px之间。
保险单识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素在15到8192px之间。
- 图像中保险单区域有效占比超过70%,保证整张保险单及其边缘包含在图像内。
- 支持图像中保险单旋转、支持少量扭曲。
- 能处理暗光等干扰的图片但影响识别精度。
- 覆盖常见保险公司的常见保单版式,由于即使是同一家保险公司,保险种类也繁多而且都在动态变化,实际支持情况请以实际测试效果为准。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
财务报表识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15px到8192px之间。
- 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
- 支持图像任意角度的水平旋转。
- 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
承兑汇票
- 只支持中英文。
- 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片。
- 图像各边的像素大小在15px到8192px之间。
- 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
- 不支持角度旋转的图片识别。
- 支持电子承兑汇票,对于拍照场景、复杂背景支持欠佳。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
银行回单识别
- 支持JPEG、JPG、PNG、BMP、TIFF、PDF格式,多页PDF默认识别第一页。
- 图像各边的像素大小在15px到8192px之间。
- 支持同时返回单张图像中存在的多张回单识别结果。
- 图像中key值对应的value值为空时,不会返回对应的键值对。
- 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
防疫健康码识别
- 支持全国不同地区健康码的识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 图像中健康码区域有效占比超过80%,保证整张健康码内容及其边缘包含在图像内。
- 推荐采用手机截图图像。
- 支持图像中健康码任意角度的水平旋转(需开启方向检测)。
- 能处理反光、暗光等干扰的图片但影响识别精度。
- 目前只支持识别单张健康码。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
核酸检测记录识别
- 支持全国不同地区健康码小程序中的核酸检测记录界面的识别。
- 支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 图像中核酸检测记录区域有效占比超过80%,保证整张核酸检测记录内容及其边缘包含在图像内。
- 推荐采用手机截图图像。
- 支持图像中核酸检测记录界面任意角度的水平旋转(需开启方向检测)。
- 能处理反光、暗光等干扰的图片但影响识别精度。
- 目前只支持识别单张核酸检测记录界面。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们联系管理员。
泰文身份证识别
- 只支持泰国身份证的识别。
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 泰国身份证识别图像各边的像素大小在15到8192px之间。
- 图像中身份证区域有效占比超过25%,保证整张身份证内容及其边缘包含在图像内。
- 支持图像中身份证任意角度的水平旋转。
- 支持少量扭曲,扭曲后图像中的身份证长宽比与实际身份证相差不超过10%。
- 能处理反光、暗光等干扰的图片但影响识别精度。
- 目前只支持识别单张身份证的正面或者反面。
- 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前。
泰国车牌识别
- 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
- 图像各边的像素大小在15到8192px之间。
- 支持图像中车牌任意角度的水平旋转。
- 能处理反光、暗光等干扰的图片但影响识别精度。