nlp
多粒度分词
更新时间:2021/01/25 GMT+08:00
功能介绍
给定一个句子输入,输出不同粒度的所有单词的层次结构。
以“华为技术有限公司的总部”为例,多粒度分词得到的层次结构如下图所示。其中白色圆形节点为字符单元,蓝色圆角矩阵节点为词汇单元。
图1 多粒度分词


本API免费调用,调用限制为2次/秒。
URI
- URI格式
POST /v1/{project_id}/nlp-fundamental/multi-grained-segment
- 参数说明
表1 URI参数说明 参数名
必选
说明
project_id
是
项目编号。获取方法,请参见获取项目ID。
请求消息
请求参数如表 请求参数所示。
响应消息
响应参数如表3所示。
参数名 |
参数类型 |
说明 |
---|---|---|
result |
Array of node objects 或 Array of strings |
分词结果。默认返回全部粒度分词树结果,如果选择了分词粒度,则返回对应粒度的词汇列表结果。 |
参数名 |
参数类型 |
说明 |
---|---|---|
content |
String |
该节点对应的文本内容,并基于文本的unicode编码,做归一化处理。 例如:中文标点","会映射到英文标点“,”。 |
type |
String |
节点类型,包括 WORD-词汇类型,CHAR-字符类型。 |
sub_contents |
Array of node objects |
子节点列表。 |
示例
- 请求示例1
POST https://{endpoint}/v1/{project_id}/nlp-fundamental/multi-grained-segment Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... Request Body: { "text": "华为技术有限公司的总部", "lang":"zh", "granularity":2 }
- 响应示例1
- 成功响应示例
{ "result": [ "华为技术有限公司", "的", "总部" ] }
- 成功响应示例
- 请求示例2
POST https://{endpoint}/v1/{project_id}/nlp-fundamental/multi-grained-segment Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... Request Body: { "text": "华为技术有限公司的总部", "lang":"zh" }
- 响应示例2
- 成功响应示例
{ "result": [ { "content": "华为技术有限公司", "sub_contents": [ { "content": "华为", "sub_contents": [ { "content": "华", "type": "CHAR" }, { "content": "为", "type": "CHAR" } ], "type": "WORD" }, { "content": "技术", "sub_contents": [ { "content": "技", "type": "CHAR" }, { "content": "术", "type": "CHAR" } ], "type": "WORD" }, { "content": "有限公司", "sub_contents": [ { "content": "有限", "sub_contents": [ { "content": "有", "type": "CHAR" }, { "content": "限", "type": "CHAR" } ], "type": "WORD" }, { "content": "公司", "sub_contents": [ { "content": "公", "type": "CHAR" }, { "content": "司", "type": "CHAR" } ], "type": "WORD" } ], "type": "WORD" } ], "type": "WORD" }, { "content": "的", "sub_contents": [ { "content": "的", "type": "CHAR" } ], "type": "WORD" }, { "content": "总部", "sub_contents": [ { "content": "总", "type": "CHAR" }, { "content": "部", "type": "CHAR" } ], "type": "WORD" } ] }
- 失败响应示例
{ "error_code": "NLP.0301", "error_msg": "the length of the text must between 1-64" }
- 成功响应示例
状态码
状态码请参见状态码。
错误码
错误码请参见错误码。
父主题: 自然语言处理基础服务接口说明
