更新时间:2024-12-31 GMT+08:00
分享

查看公共推理服务

推理端点试用期内,可以直接使用公共推理服务进行推理。目前的公共推理服务是基于开源大模型部署的,列表如下(实际的推理服务以服务为准):

表1 公共推理服务

名称

描述

免费额度

最大上下文长度

prompt模板长度

最大输出token

QWEN_2_72B

Qwen2在包括语言理解、生成、多语言能力、编码、数学和推理在内的多个基准测试中,超越了大多数以前的开放权重模型,与专有模型表现出竞争力。该模型参数规模为720亿。

公测期间提供100万token免费配额,超过配额不可用,也没办法再购买;有效期为服务开通90天内,超过时间则失效。

16k

23

16360

相关文档