AI原生应用引擎计费项

计费说明

AI原生应用引擎根据购买的套餐包计费或按需计费。具体内容如表1所示。

表1 AI原生应用引擎计费项说明
计费项	计费项说明	适用的计费模式	计费公式
ChatGLM3-6B大模型服务API在线调用	根据实际输入和输出tokens总量计费，平台提供算力支持。	按需计费	千tokens * 每千tokens单价
大模型微调服务API在线调用-SFT局部调优	根据实际输入和输出tokens总量计费，平台提供算力支持。	按需计费	千tokens * 每千tokens单价
推理单元	将基础或者预训练后的模型部署为在线服务时使用的算力单元，通过购买推理单元实现服务QPS扩容。	包年/包月	包年/包月：实例数量实例单价购买时长
大模型调用	大模型调用次数。	包年/包月：与“知识库容量”、“应用并发用户数”一起构成套餐包。	按小、中、大规格计费。
知识库容量	知识库容量大小	包年/包月：与“大模型调用”、“应用并发用户数”一起构成套餐包。
应用并发用户数	同时访问应用的用户数。	包年/包月：与“大模型调用”、“知识库容量”一起构成套餐包。
容量包	容量包数量。	包年/包月	容量包数量容量包单价计费时长
实例包	实例包数量。	包年/包月	实例包数量实例包单价计费时长
AI原生应用引擎基础版	支持知识库容量，智能应用运行时引擎，开通ChatGLM3-6B服务、大模型调优服务API在线调用。	包年/包月+按需计费	包年/包月单价*计费时长+按需
AI原生应用引擎专业版	支持知识库容量，智能应用运行时引擎，开通ChatGLM3-6B服务、大模型调优服务API在线调用。	包年/包月+按需计费	包年/包月单价*计费时长+按需
AI原生应用引擎企业版	支持知识库容量，智能应用运行时引擎，开通ChatGLM3-6B服务、大模型调优服务API在线调用。	包年/包月+按需计费	包年/包月单价*计费时长+按需