更新时间:2024-04-22 GMT+08:00

加载自定义词库

功能介绍

该接口用于加载存放于OBS的自定义词库。

调试

您可以在API Explorer中调试该接口,支持自动认证鉴权。

URI

POST /v1.0/{project_id}/clusters/{cluster_id}/thesaurus

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

项目ID。获取方法请参见获取项目ID和名称

cluster_id

String

指定配置自定义词库的集群ID。

请求参数

表2 请求Body参数

参数

是否必选

参数类型

描述

bucketName

String

词库文件存放的OBS桶(桶类型必须为标准存储或者低频存储,不支持归档存储)。

mainObject

String

主词库文件对象,必须为UTF-8无BOM编码的文本文件,一行一个分词,文件大小最大支持100M。 mainObject, stopObject, synonymObject三个参数至少要填写一个。

说明:

一次只能加载一个主词库,不支持同时加载多个主词库。

stopObject

String

停词词库文件对象,必须为UTF-8无BOM编码的文本文件,一行一个分词,文件大小最大支持20M。

mainObject, stopObject, synonymObject三个参数至少要填写一个。

synonymObject

String

同义词词库文件,必须为UTF-8无BOM编码的文本文件,一行一组分词,文件大小最大支持20M。

mainObject, stopObject, synonymObject三个参数至少要填写一个。

响应参数

请求示例

开启并配置词库信息。

POST /v1.0/6204a5bd270343b5885144cf9c8c158d/clusters/4f3deec3-efa8-4598-bf91-560aad1377a3/thesaurus

{
  "bucketName" : "test-bucket",
  "mainObject" : "word/main.txt",
  "stopObject" : "word/stop.txt",
  "synonymObject" : "word/synonym.txt"
}

响应示例

状态码

状态码

描述

200

请求已成功。

403

请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。

500

表明服务端能被请求访问到,但是不能理解用户的请求。

错误码

请参见错误码