文档首页> 应用平台 AppStage> API参考> API> 在线测试> 我部署的向量化推理服务API在线测试
更新时间:2024-02-18 GMT+08:00
分享

我部署的向量化推理服务API在线测试

功能介绍

向量化模型服务将用户输入的文本转化成数字向量,多用于从向量化知识库中查询相似的文本。

URI

POST /v1/model-online-test/inference-service/test/{serviceId}/{modelName}/embedding-batch

表1 路径参数

参数

是否必选

参数类型

描述

modelName

String

模型名称,目前支持bge-large-zh-v1.5。

serviceId

String

私人部署的模型服务ID。

请求参数

表2 请求Body参数

参数

是否必选

参数类型

描述

text

Array of strings

输入的多条句子列表。

响应参数

状态码: 200

表3 响应Body参数

参数

参数类型

描述

vectors

Array of objects

输入的多条句子转换的向量表示。

input_token_length

Integer

输入token数。

请求示例

https://{endpoint}/v1/model-online-test/inference-service/test/{serviceId}/{modelName}/embedding-batch

{
  "text" : [ "你好,你是哪个模型", "那是一个快乐的人", "那是一个快乐的狗" ]
}

响应示例

状态码: 200

OK

{
  "vectors" : [ [ 0.017777875065803528, -0.027557365596294403, -0.03859279677271843, 0.02317819744348526, "......" ], [ 0.00554633280262351, -0.04635364189743996, -0.07506467401981354, 0.03592068701982498, "......" ], [ 0.036464523524045944, -0.05596702918410301, 0.028902683407068253, 0.007492372300475836, "......" ] ],
  "input_token_length" : 13
}

状态码

状态码

描述

200

OK

201

Created

401

Unauthorized

403

Forbidden

404

Not Found

错误码

请参见错误码

分享:

    相关文档

    相关产品