更新时间:2023-10-26 GMT+08:00

解读识别结果

本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。

以下图识别结果为例,讲解图片内容如何与API的返回字段对应。

图1 网络图片

调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。

  • result字段仅在API调用成功后返回。
  • words_block_count表示文字块识别结果,本示例中,识别出2个文字块,分别代表图片中的2行文字。
  • words_block_list表示文字块列表,按照图片文字从上到下、从左到右排列。
  • words为识别出来的文本内容,confidence表示该字段的置信度。
  • location表示文字块的区域位置信息,采用图像坐标系,第一个文字块左上角顶点为[184,606]。
  • extracted_data表示图片中的图像宽高,仅在设置了入参extract_type时,支持提取。
    {
     "result": {
      "words_block_list": [
       {
        "words": "School",
        "confidence": 0.891,
        "location": [
         [
          184,
          606
         ],
         [
          461,
          608
         ],
         [
          461,
          684
         ],
         [
          184,
          682
         ]
        ]
       },
       {
        "words": "Children going to or from school",
        "confidence": 0.9115,
        "location": [
         [
          85,
          779
         ],
         [
          554,
          778
         ],
         [
          554,
          820
         ],
         [
          85,
          821
         ]
        ]
       }
      ],
      "words_block_count": 2,
      "extracted_data": {}
     }
    }