AI原生应用引擎计费项
计费说明
AI原生应用引擎根据购买的套餐包计费或按需计费。具体内容如表1所示。
计费项 |
计费项说明 |
适用的计费模式 |
计费公式 |
---|---|---|---|
ChatGLM3-6B大模型服务API在线调用 |
根据实际输入和输出tokens总量计费,平台提供算力支持。 |
按需计费 |
千tokens * 每千tokens单价 |
大模型微调服务API在线调用-SFT局部调优 |
根据实际输入和输出tokens总量计费,平台提供算力支持。 |
按需计费 |
千tokens * 每千tokens单价 |
推理单元 |
将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 |
包年/包月 |
包年/包月:实例数量*实例单价*购买时长 |
大模型调用 |
大模型调用次数。 |
包年/包月:与“应用并发用户数”一起构成套餐包。 |
按小、中、大规格计费。 |
应用并发用户数 |
同时访问应用的用户数。 |
包年/包月:与“大模型调用”一起构成套餐包。 |
|
容量包 |
容量包数量。 |
包年/包月 |
容量包数量*容量包单价*计费时长 |
实例包 |
实例包数量。 |
包年/包月 |
实例包数量*实例包单价*计费时长 |