文档首页> 应用平台 AppStage> API参考> API> 在线测试> 我部署的对话推理服务API在线测试

更新时间：2024-02-18 GMT+08:00

我部署的对话推理服务API在线测试

功能介绍

调用大语言模型推理服务，根据用户问题，获取大语言模型的回答。非流式接口提供大语言模型完整生成回答后一次性返回。

URI

POST /v1/model-online-test/inference-service/test/{serviceId}/{modelName}/chat

表1 路径参数
参数	是否必选	参数类型	描述
modelName	是	String	模型名称，目前支持baichuan-13b-chat、chatglm3-6b。
serviceId	是	String	私人部署的模型服务ID。

请求参数

表2 请求Body参数
参数	是否必选	参数类型	描述
history	否	Array of Array of objects	历史对话信息。
max_length	否	Integer	输入加输出最大token数。
max_new_tokens	否	Integer	输出最大token数。
query	是	String	对话输入。
repetition_penalty	否	Float	重复惩罚。
temperature	否	Float	温度。
system	否	String	角色。
do_sample	否	Boolean	是否概率采样token得到结果。
top_p	否	Float	多样性。

响应参数

状态码： 200

表3 响应Body参数
参数	参数类型	描述
history	Array of Array of objects	历史对话信息。
query	String	对话输入。
input_token_length	Integer	输入token数。
output_token_length	Integer	输出token数。
response	String	响应信息。
request_id	String	请求ID。

请求示例

https://{endpoint}/v1/model-online-test/inference-service/test/{serviceId}/{modelName}/chat

{
  "query" : "请介绍一下你自己",
  "history" : [ ],
  "system" : "你是一名程序员",
  "do_sample" : true,
  "max_length" : 2048,
  "max_new_tokens" : 1024,
  "temperature" : 0.8,
  "top_p" : 0.1,
  "repetition_penalty" : 1.1
}

响应示例

状态码： 200

{
  "input_token_length" : 10,
  "response" : "我是一名人工智能助手，擅长处理各种问题，帮助用户解答疑问、提供建议和执行任务。我的知识库不断更新，可以为用户提供最新的信息和最专业的建议。我可以帮助用户编写代码、优化算法、分析数据以及其他各种编程需求。此外，我还具备自然语言处理能力，可以与用户进行流畅的对话，提供实时的帮助和支持。",
  "query" : "请介绍一下你自己",
  "history" : [ [ "请介绍一下你自己", "我是一名人工智能助手，擅长处理各种问题，帮助用户解答疑问、提供建议和执行任务。我的知识库不断更新，可以为用户提供最新的信息和最专业的建议。我可以帮助用户编写代码、优化算法、分析数据以及其他各种编程需求。此外，我还具备自然语言处理能力，可以与用户进行流畅的对话，提供实时的帮助和支持。" ] ],
  "output_token_length" : 82,
  "request_id" : "7f340105-7243-45c6-9388-2d32603c24ea-1706237665137234"
}

状态码

状态码	描述
200	OK
201	Created
401	Unauthorized
403	Forbidden
404	Not Found

错误码

请参见错误码。

父主题： 在线测试

上一篇：在线测试

下一篇：我部署的向量化推理服务API在线测试

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

我部署的对话推理服务API在线测试

功能介绍

URI

请求参数

响应参数

请求示例

响应示例

状态码

错误码

相关文档

相关产品

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线