文档首页> 应用平台 AppStage> 计费说明> 计费项> AI原生应用引擎计费项
更新时间:2024-06-03 GMT+08:00
分享

AI原生应用引擎计费项

计费说明

AI原生应用引擎会根据用户调用预置模型服务时实际输入和输出tokens总量以及创建推理服务(模型部署)所需购买的推理单元收费。具体内容如表1所示。

表1 AI原生应用引擎计费项说明

计费项

计费项说明

适用的计费模式

大模型微调服务API在线调用-SFT局部调优

调用大模型Lora微调服务API时根据实际的输入和输出tokens总量收费(平台提供算力支持)。

按需计费

推理单元包周期

将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买更多推理单元实现服务QPS扩容。

包年/包月

问答AI服务基础版

包含问答能力,小规格:

  • 5000万 token 大模型调用
  • 10个用户(应用最大激活态用户量)

包年

包含问答能力,中规格:

  • 1亿 token 大模型调用
  • 25个用户(应用最大激活态用户量)

包年

包含问答能力,大规格:

  • 2亿 token 大模型调用
  • 50个用户(应用最大激活态用户量)

包年

问答AI服务专业版

包含问答、问数能力,小规格:

  • 5000万 token 大模型调用
  • 10个用户(应用最大激活态用户量)

包年

包含问答、问数能力,中规格:

  • 1亿 token 大模型调用
  • 25个用户(应用最大激活态用户量)

包年

包含问答、问数能力,大规格:

  • 2亿 token 大模型调用
  • 50个用户(应用最大激活态用户量)

包年

分享:

    相关文档

    相关产品