文档首页 > > API参考> API> 自然语言处理基础服务接口说明> 多粒度分词

多粒度分词

分享
更新时间:2020/07/13 GMT+08:00

功能介绍

给定一个句子输入,输出不同粒度的所有单词的层次结构。

以“华为技术有限公司的总部”为例,多粒度分词得到的层次结构如下图所示。其中白色圆形节点为字符单元,蓝色圆角矩阵节点为词汇单元。

图1 多粒度分词

本API免费调用,调用限制为2次/秒。

URI

  • URI格式
    POST /v1/{project_id}/nlp-fundamental/multi-grained-segment
  • 参数说明
    表1 URI参数说明

    参数名

    必选

    说明

    project_id

    项目编号。获取方法,请参见获取项目ID

请求消息

请求参数如表 请求参数所示。

表2 请求参数

参数名

参数类型

必选

说明

text

String

待分析文本,长度为1~64,文本编码为UTF-8。

lang

String

支持的文本语言类型,目前支持中文(zh)和英文(en),默认为中文。

granularity

Integer

分词粒度,1为最细粒度,2为最粗粒度,其它情况默认返回全部粒度分词树结果。

响应消息

响应参数如表3所示。

表3 响应参数

参数名

参数类型

说明

result

Array of node objects 或 Array of strings

分词结果。默认返回全部粒度分词树结果,如果选择了分词粒度,则返回对应粒度的词汇列表结果。

表4 node字段数据结构说明

参数名

参数类型

说明

content

String

该节点对应的文本内容,并基于文本的unicode编码,做归一化处理。

例如:中文标点","会映射到英文标点“,”。

type

String

节点类型,包括 WORD-词汇类型,CHAR-字符类型。

sub_contents

Array of node objects

子节点列表。

示例

  • 请求示例1
    POST https://{endpoint}/v1/{project_id}/nlp-fundamental/multi-grained-segment
    
    Request Header:
        Content-Type: application/json
        X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...
    
    Request Body:
       {
           "text": "华为技术有限公司的总部",
           "lang":"zh",
           "granularity":2
        }
    
  • 响应示例1
    • 成功响应示例
      {
        "result": [
          "华为技术有限公司",
          "的",
          "总部"
        ]
      }
  • 请求示例2
    POST https://{endpoint}/v1/{project_id}/nlp-fundamental/multi-grained-segment
    
    Request Header:
        Content-Type: application/json
        X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...
    
    Request Body:
       {
           "text": "华为技术有限公司的总部",
           "lang":"zh"
        }
    
  • 响应示例2
    • 成功响应示例
      {
        "result": [
          {
            "content": "华为技术有限公司",
            "sub_contents": [
              {
                "content": "华为",
                "sub_contents": [
                  {
                    "content": "华",
                    "type": "CHAR"
                  },
                  {
                    "content": "为",
                    "type": "CHAR"
                  }
                ],
                "type": "WORD"
              },
              {
                "content": "技术",
                "sub_contents": [
                  {
                    "content": "技",
                    "type": "CHAR"
                  },
                  {
                    "content": "术",
                    "type": "CHAR"
                  }
                ],
                "type": "WORD"
              },
              {
                "content": "有限公司",
                "sub_contents": [
                  {
                    "content": "有限",
                    "sub_contents": [
                      {
                        "content": "有",
                        "type": "CHAR"
                      },
                      {
                        "content": "限",
                        "type": "CHAR"
                      }
                    ],
                    "type": "WORD"
                  },
                  {
                    "content": "公司",
                    "sub_contents": [
                      {
                        "content": "公",
                        "type": "CHAR"
                      },
                      {
                        "content": "司",
                        "type": "CHAR"
                      }
                    ],
                    "type": "WORD"
                  }
                ],
                "type": "WORD"
              }
            ],
            "type": "WORD"
          },
          {
            "content": "的",
            "sub_contents": [
              {
                "content": "的",
                "type": "CHAR"
              }
            ],
            "type": "WORD"
          },
          {
            "content": "总部",
            "sub_contents": [
              {
                "content": "总",
                "type": "CHAR"
              },
              {
                "content": "部",
                "type": "CHAR"
              }
            ],
            "type": "WORD"
          }
        ]
      }
    • 失败响应示例
      {
          "error_code": "NLP.0301",
          "error_msg": "the length of the text must between 1-64"
      }

状态码

状态码请参见状态码

错误码

错误码请参见错误码

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问