函数实例类型与使用模式

本文为您介绍函数CPU实例和GPU实例的实例模式、计费方式及实例规格。

函数实例有以下两种实例类型：

CPU实例：函数工作流的基本实例，适用于突发流量和计算密集等场景。
GPU实例：提供基于Turing架构的GPU实例，适用于音视频、AI人工智能和图像处理等场景。在各场景中，不同业务负载通过GPU硬件加速，以提升业务处理效率。
GPU实例仅支持通过容器镜像和定制运行时方式部署。

关于使用GPU实例的最佳实践，可以参见使用FunctionGraph部署DeepSeek-R1蒸馏模型。

CPU实例和GPU实例均支持两种实例模式：按量模式和预留模式。两种实例模式说明如下：

按量模式是指函数实例的分配和释放完全由函数工作流系统负责，函数工作流会根据函数的调用量自动调整实例数量：在调用请求增加时创建实例，减少后销毁实例。

在函数使用过程中，请求会自动触发函数实例的创建，若实例在一段时间内（通常为1分钟）不处理请求，则自动销毁。初次调用时，需等待实例冷启动。

约束与限制：

单个华为云账号（子账号）在单个区域内总实例数默认限制为1000。如果业务有更大的实例数需求，请提交工单申请。

计费方式：

按量模式下，函数执行时长的计量从请求触发函数执行开始，直至请求处理完成结束。该模式下，单个实例可处理单个请求（单实例单并发），或根据配置支持并发处理多个请求（单实例多并发）。执行时长说明请参见表1，具体配置方法请参见配置函数的并发处理。

当无函数调用时，系统不会分配计算资源，因此不产生费用；仅在函数被实际调用并执行时，才会根据资源使用情况计费。详细的产品定价与计费规则，请参见计费概述。

表1 请求方式执行时长说明
请求方式	执行时长说明	示例
单实例单并发	一个实例执行一个请求时，执行时长的计量从请求到达实例开始，至请求执行完毕结束。	若请求在 00:00:00 到达，于 00:00:05 结束，则计费时长为5秒。若同时有三个请求到达并各自耗时5秒，则总计费时长为 3×5=15秒。
单实例多并发	一个实例并发执行多个请求时，执行时长的计量从第一个请求到达实例开始，至最后一个请求执行完毕结束，可以复用资源节省费用。	第一个请求在 00:00:00 到达，于 00:00:05 结束，最后一个请求在 00:00:03 到达，于 00:00:08 结束，他们会在同一个实例中执行，则总计费时长为8秒。

预留模式通过用户自主管理函数实例的生命周期，实现对计算资源的灵活控制。当用户为函数配置预留实例后，FunctionGraph在接收到调用请求时将优先调度至常驻的预留实例进行处理。当业务流量超出预留资源承载能力时，系统将自动触发弹性扩缩容机制，通过按量实例动态分配执行环境以保障服务连续性。

该模式下，预留实例在创建阶段即完成函数代码、依赖组件的预加载，并执行初始化入口函数，从而构建出持久化的执行环境。这种常驻机制可显著降低冷启动带来的延迟问题，因此如果希望降低冷启动时间，预留模式是最佳方案。建议根据业务资源预算选择配置固定数量的预留实例策略，根据波峰波谷特性配置定时伸缩的预留实例策略、按指标伸缩的预留实例策略和智能伸缩的预留实例策略。

注意事项：

需注意不要依赖预留实例本身的初始化入口函数去执行一次性业务，以确保服务的稳定性和可靠性。

计费方式：

请参考计费项中计费说明的执行时间费用（预留实例）部分和预留实例计费规则。

CPU实例

CPU实例包含以下实例规格，可以根据业务需求选择不同配置的实例。

表2 CPU实例规格
内存规格	代码包大小上限	函数执行时长上限	磁盘大小上限
128~32768MB 取值说明：必须为64的倍数。	ZIP文件：解压后原始代码大小为1.5GB。上传OBS桶中的文件：最大可上传300MB压缩后的代码包。	259200s 如需调用执行时间超过900秒的函数，请使用异步调用的方式。	取值说明：可选512MB或10GB，默认值为512MB。

GPU实例

GPU实例包含以下实例规格，可以根据业务需求选择不同配置的实例。

表3 GPU实例规格
显卡类型	整卡显存	整卡算力（TFLOPS）		可选切分规格		是否支持按量模式	是否支持普通预留模式	是否支持闲置预留模式
NVIDIA T4	16GB	FP16算力	FP32算力	显存（MB）	内存规格（MB）	是	是	是
NVIDIA T4	16GB	65	8	1024~16384（对应1GB~16GB）取值说明：必须为1024 MB的倍数。	128~32768 取值说明：必须为64的倍数。	是	是	是