我部署的向量化推理服务API在线测试
功能介绍
向量化模型服务将用户输入的文本转化成数字向量,多用于从向量化知识库中查询相似的文本。
URI
POST /v1/model-online-test/inference-service/test/{serviceId}/{modelName}/embedding-batch
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
modelName |
是 |
String |
模型名称,目前支持bge-large-zh-v1.5。 |
serviceId |
是 |
String |
私人部署的模型服务ID。 |
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
text |
是 |
Array of strings |
输入的多条句子列表。 |
响应参数
状态码: 200
参数 |
参数类型 |
描述 |
---|---|---|
vectors |
Array of objects |
输入的多条句子转换的向量表示。 |
input_token_length |
Integer |
输入token数。 |
请求示例
https://{endpoint}/v1/model-online-test/inference-service/test/{serviceId}/{modelName}/embedding-batch { "text" : [ "你好,你是哪个模型", "那是一个快乐的人", "那是一个快乐的狗" ] }
响应示例
状态码: 200
OK
{ "vectors" : [ [ 0.017777875065803528, -0.027557365596294403, -0.03859279677271843, 0.02317819744348526, "......" ], [ 0.00554633280262351, -0.04635364189743996, -0.07506467401981354, 0.03592068701982498, "......" ], [ 0.036464523524045944, -0.05596702918410301, 0.028902683407068253, 0.007492372300475836, "......" ] ], "input_token_length" : 13 }
状态码
状态码 |
描述 |
---|---|
200 |
OK |
201 |
Created |
401 |
Unauthorized |
403 |
Forbidden |
404 |
Not Found |
错误码
请参见错误码。