AI原生应用引擎计费项
计费说明
AI原生应用引擎根据购买的套餐包计费或按需计费。具体内容如表1所示。
| 计费项 | 计费项说明 | 适用的计费模式 | 计费公式 |
|---|---|---|---|
| ChatGLM3-6B大模型服务API在线调用 | 根据实际输入和输出tokens总量计费,平台提供算力支持。 | 按需计费 | 千tokens * 每千tokens单价 |
| 大模型微调服务API在线调用-SFT局部调优 | 根据实际输入和输出tokens总量计费,平台提供算力支持。 | 按需计费 | 千tokens * 每千tokens单价 |
| 推理单元 | 将基础或者预训练后的模型部署为在线服务时使用的算力单元,通过购买推理单元实现服务QPS扩容。 | 包年/包月 | 包年/包月:实例数量*实例单价*购买时长 |
| 大模型调用 | 大模型调用次数。 | 包年/包月:与“知识库容量”、“应用并发用户数”一起构成套餐包。 | 按小、中、大规格计费。 |
| 知识库容量 | 知识库容量大小 | 包年/包月:与“大模型调用”、“应用并发用户数”一起构成套餐包。 | |
| 应用并发用户数 | 同时访问应用的用户数。 | 包年/包月:与“大模型调用”、“知识库容量”一起构成套餐包。 | |
| 容量包 | 容量包数量。 | 包年/包月 | 容量包数量*容量包单价*计费时长 |
| 实例包 | 实例包数量。 | 包年/包月 | 实例包数量*实例包单价*计费时长 |
| AI原生应用引擎基础版 | 支持知识库容量,智能应用运行时引擎,开通ChatGLM3-6B服务、大模型调优服务API在线调用。 | 包年/包月+按需计费 | 包年/包月单价*计费时长+按需 |
| AI原生应用引擎专业版 | 支持知识库容量,智能应用运行时引擎,开通ChatGLM3-6B服务、大模型调优服务API在线调用。 | 包年/包月+按需计费 | 包年/包月单价*计费时长+按需 |
| AI原生应用引擎企业版 | 支持知识库容量,智能应用运行时引擎,开通ChatGLM3-6B服务、大模型调优服务API在线调用。 | 包年/包月+按需计费 | 包年/包月单价*计费时长+按需 |