更新时间:2024-12-02 GMT+08:00

加载自定义词库

功能介绍

该接口用于加载存放于OBS的自定义词库。

调用方法

请参见如何调用API

URI

POST /v1.0/{project_id}/clusters/{cluster_id}/thesaurus

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

项目ID。获取方法请参见获取项目ID和名称

cluster_id

String

指定配置自定义词库的集群ID。

请求参数

表2 请求Body参数

参数

是否必选

参数类型

描述

bucketName

String

词库文件存放的OBS桶(桶类型必须为标准存储或者低频存储,不支持归档存储)。

mainObject

String

主词词库文件对象,必须为UTF-8无BOM编码的文本文件,一行一个分词,文件大小最大支持100M。

7个词库参数至少修改一个词库。注:参数传递""空字符串为清空此词库,不传或传递null为不修改。

stopObject

String

停词词库文件对象,必须为UTF-8无BOM编码的文本文件,一行一个分词,文件大小最大支持100M。

7个词库参数至少修改一个词库。注:参数传递""空字符串为清空此词库,不传或传递null为不修改。

synonymObject

String

同义词词库文件,必须为UTF-8无BOM编码的文本文件,一行一组分词,文件大小最大支持100M。

7个词库参数至少修改一个词库。注:参数传递""空字符串为清空此词库,不传或传递null为不修改。

static_main_object

String

静态主词词库文件,必须为UTF-8无BOM编码的文本文件,一行一组分词,文件大小最大支持100M。

7个词库参数至少修改一个词库。注:参数传递""空字符串为清空此词库,不传或传递null为不修改。仅支持此词库功能上线后的新集群。

static_stop_object

String

静态停词词库文件,必须为UTF-8无BOM编码的文本文件,一行一组分词,文件大小最大支持100M。

7个词库参数至少修改一个词库。注:参数传递""空字符串为清空此词库,不传或传递null为不修改。仅支持此词库功能上线后的新集群。

extra_main_object

String

Extra主词词库文件,必须为UTF-8无BOM编码的文本文件,一行一组分词,文件大小最大支持100M。

7个词库参数至少修改一个词库。注:参数传递""空字符串为清空此词库,不传或传递null为不修改。仅支持此词库功能上线后的新集群。

extra_stop_object

String

Extra停词词库文件,必须为UTF-8无BOM编码的文本文件,一行一组分词,文件大小最大支持100M。

7个词库参数至少修改一个词库。注:参数传递""空字符串为清空此词库,不传或传递null为不修改。仅支持此词库功能上线后的新集群。

响应参数

请求示例

开启并配置词库信息。

POST /v1.0/6204a5bd270343b5885144cf9c8c158d/clusters/4f3deec3-efa8-4598-bf91-560aad1377a3/thesaurus

{
  "bucketName" : "test-bucket",
  "mainObject" : "word/main.txt",
  "stopObject" : "word/stop.txt",
  "synonymObject" : "word/synonym.txt",
  "static_main_object" : "word/staticMain.txt",
  "static_stop_object" : "word/staticStop.txt",
  "extra_main_object" : "word/extraMain.txt",
  "extra_stop_object" : "word/extraStop.txt"
}

响应示例

状态码

状态码

描述

200

请求已成功。

403

请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。

500

表明服务端能被请求访问到,但是不能理解用户的请求。

错误码

请参见错误码