文档首页 > > API参考> API> 通用表格识别

通用表格识别

分享
更新时间: 2019/10/30 GMT+08:00

功能介绍

文字识别OCR通用表格识别用于识别用户上传的通用表格图片(或者用户提供的华为云上OBS的通用表格图片文件的URL)中的文字内容,并将识别的结果返回给用户。

URI

URI格式:

POST /v1.0/ocr/general-table

请求消息

通用表格识别请求参数说明请参见 表1
表1 请求参数说明

参数

是否必选

类型

说明

image

与url二选一

String

图像数据,base64编码,要求base64编码后大小不超过10M。图片最小边不小于15像素,最长边不超过4096像素,支持JPEG/JPG/PNG/BMP/TIFF格式。

url

与image二选一

String

图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。

return_confidence

Boolean

是否返回置信度的开关,可选值包括:

true:返回置信度

false:不返回置信度

如果无该参数,系统默认不返回置信度。如果输入参数不是Boolean类型,则会报非法参数错误。

响应消息

通用表格识别响应参数说明请参见 表2
表2 响应参数说明

参数

类型

说明

result

Object

调用成功时表示调用结果。

调用失败时无此字段。

words_region_count

Integer

文字区域数目。

words_region_list

Array of objects

文字区域识别结果列表,输出顺序从左到右,先上后下。

type

String

文字识别区域类型。

  • text:文本识别区域
  • table:表格识别区域

words_block_count

String

子区域识别文字块数目。

words_block_list

Array of objects

子区域识别文字块列表,输出顺序从左到右,先上后下。

words

String

文字块识别结果。

rows

Array of integers

文字块占用的行信息,编号从0开始,列表形式,数据类型为Integer。仅在表格区域内有效,即type字段为"table"时该字段有效。

columns

Array of integers

文字块占用的列信息,编号从0开始,列表形式,数据类型为Integer。仅在表格区域内有效,即type字段为"table"时该字段有效。

confidence

Float

字段的平均置信度,置信度越大,表示本次识别的对应字段的可靠性越高,在统计意义上,置信度越大,准确率越高。

置信度由算法给出,不直接等价于对应字段的准确率。

error_code

String

调用失败时的错误码,具体请参见错误码

调用成功时无此字段。

error_msg

String

调用失败时的错误信息。

调用成功时无此字段。

示例

  • 请求示例(方式一:使用图片的BASE64编码)
    POST https://{endpoint}/v1.0/ocr/general-table 
        
     Request Header:   
     Content-Type: application/json   
     X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...      
     Request Body:
     {   
        "image":"/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAAg...",
        "return_confidence":false
      }
  • 请求示例(方式二:使用图片URL)
    POST https://{endpoint}/v1.0/ocr/general-table 
        
     Request Header:   
     Content-Type: application/json   
     X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...      
     Request Body:
     {
         "url":"https://BucketName.obs.myhuaweicloud.com/ObjectName",
         "return_confidence":false
      }

Endpoint即调用API的请求地址,不同服务不同区域的Endpoint不同,具体请参见终端节点

例如通用表格识别服务部署在“华北-北京四”区域的Endpoint为“ocr.cn-north-4.myhuaweicloud.com”,请求URL为“https://ocr.cn-north-4.myhuaweicloud.com/v1.0/ocr/general-table”。

  • 成功响应示例
    {
        "result": {
            "words_region_count": 2,
            "words_region_list": [
                {
                   "type": "text",
                   "words_block_count": 1,
                   "words_block_list": [  
                        {
                           "words":"文字区域识别文字块1",
                           "confidence": 0.9991
                        }
                   ]
                },
                {
                   "type": "table",
                   "words_block_count": 2,
                   "words_block_list": [
                       {
                            "words":"表格区域识别文字块1",
                            "confidence": 0.9942,
                            "rows":[
                                0
                            ],
                            "columns":[
                                0
                            ]
                        },
                        {
                            "words":"表格区域识别文字块2",
                            "confidence": 0.9140,
                            "rows":[
                                0
                            ],
                            "columns":[
                                1,
                                2
                            ]
                        }
                    ]
                }
            ]
        }
    }
  • 失败响应示例
    {
        "error_code": "AIS.0103",
        "error_msg": "The image size does not meet the requirements."
    }

状态码

状态码请参见状态码

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区