AI原生应用引擎计费项
计费说明
AI原生应用引擎会根据用户调用预置模型服务时实际输入和输出tokens总量以及创建推理服务(模型部署)所需购买的推理单元收费。具体内容如表1所示。
计费项 |
计费项说明 |
适用的计费模式 |
---|---|---|
大模型微调服务API在线调用-SFT局部调优 |
调用大模型Lora微调服务API时根据实际的输入和输出tokens总量收费(平台提供算力支持)。 |
按需计费 |
推理单元包周期 |
将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买更多推理单元实现服务QPS扩容。 |
包年/包月 |
问答AI服务基础版 |
包含问答能力,小规格:
|
包年 |
包含问答能力,中规格:
|
包年 |
|
包含问答能力,大规格:
|
包年 |
|
问答AI服务专业版 |
包含问答、问数能力,小规格:
|
包年 |
包含问答、问数能力,中规格:
|
包年 |
|
包含问答、问数能力,大规格:
|
包年 |