更新时间:2021-03-18 GMT+08:00
分享

多粒度分词

  • 请求示例
    //按照初始化Client章节选择认证方式构造client,同一个认证Client建议以单例形式构造使用,避免频繁创建对象。以AKSK方式为例
    
    NlpfClient client = new NlpfClient(AuthMode.AKSK,authInfo);
    
    MultiGrainedSegmentReq req = new MultiGrainedSegmentReq();
    req.setText("华为技术有限公司的总部");
    req.setLang("zh");
    
    try {
        MultiGrainedSegmentResp resp = client.multiGrainedSegment(req);
    } catch (NlpException e) {
        //失败统一以异常形式抛出,详情见异常类说明。客户端自行处理异常
    }
  • MultiGrainedSegmentReq 类参数说明见表1
    表1 MultiGrainedSegmentReq 类参数说明

    参数名称

    是否必选

    类型

    说明

    text

    String

    待分析文本,长度为1~64,文本编码为UTF-8。

    lang

    String

    支持的文本语言类型,目前只支持中文,默认为zh。

  • MultiGrainedSegmentResp 类参数说明见表2
    表2 MultiGrainedSegmentResp 类参数说明

    参数名称

    类型

    说明

    result

    List<SegmentSubContents>

    分词结果列表。

  • SegmentSubContents 类参数说明见表3
    表3 SegmentSubContents 类参数说明

    参数名称

    类型

    说明

    content

    String

    该节点对应的文本内容,并基于文本的unicode编码,做归一化处理。

    例如:中文标点","会映射到英文标点“,”。

    type

    String

    节点类型,包括 WORD-词汇类型,CHAR-字符类型。

    subContents

    List<SegmentSubContents>

    子节点列表。

分享:

    相关文档

    相关产品

close