函数实例类型与使用模式
本文为您介绍函数CPU实例和GPU实例的实例模式、计费方式及实例规格。
实例类型
函数实例有以下两种实例类型:
- CPU实例:函数工作流的基本实例,适用于突发流量和计算密集等场景。
- GPU实例:提供基于Turing架构的GPU实例,适用于音视频、AI人工智能和图像处理等场景。在各场景中,不同业务负载通过GPU硬件加速,以提升业务处理效率。
GPU实例仅支持通过容器镜像和定制运行时方式部署,仅支持在“华东-上海一”区域下部署。
关于使用GPU实例的最佳实践,可以参见使用FunctionGraph部署DeepSeek-R1蒸馏模型。
实例模式
CPU实例和GPU实例均支持两种实例模式:按量模式和预留模式。两种实例模式说明如下:
按量模式是指函数实例的分配和释放完全由函数工作流系统负责,函数工作流会根据函数的调用量自动调整实例数量:在调用请求增加时创建实例,减少后销毁实例。
在函数使用过程中,请求会自动触发函数实例的创建,若实例在一段时间内(通常为1分钟)不处理请求,则自动销毁。初次调用时,需等待实例冷启动。
约束与限制:
单个华为云账号(子账号)在单个区域内总实例数默认限制为1000。如果业务有更大的实例数需求,请提交工单申请。
计费方式:
按量模式下,函数执行时长的计量从请求触发函数执行开始,直至请求处理完成结束。该模式下,单个实例可处理单个请求(单实例单并发),或根据配置支持并发处理多个请求(单实例多并发)。执行时长说明请参见表1,具体配置方法请参见配置函数的并发处理。
当无函数调用时,系统不会分配计算资源,因此不产生费用;仅在函数被实际调用并执行时,才会根据资源使用情况计费。详细的产品定价与计费规则,请参见计费概述。
请求方式 |
执行时长说明 |
示例 |
---|---|---|
单实例单并发 |
一个实例执行一个请求时,执行时长的计量从请求到达实例开始,至请求执行完毕结束。 |
|
单实例多并发 |
一个实例并发执行多个请求时,执行时长的计量从第一个请求到达实例开始,至最后一个请求执行完毕结束,可以复用资源节省费用。 |
第一个请求在 00:00:00 到达,于 00:00:05 结束,最后一个请求在 00:00:03 到达,于 00:00:08 结束,他们会在同一个实例中执行,则总计费时长为8秒。 |
预留模式通过用户自主管理函数实例的生命周期,实现对计算资源的灵活控制。当用户为函数配置预留实例后,FunctionGraph在接收到调用请求时将优先调度至常驻的预留实例进行处理。当业务流量超出预留资源承载能力时,系统将自动触发弹性扩缩容机制,通过按量实例动态分配执行环境以保障服务连续性。
该模式下,预留实例在创建阶段即完成函数代码、依赖组件的预加载,并执行初始化入口函数,从而构建出持久化的执行环境。这种常驻机制可显著降低冷启动带来的延迟问题,因此如果希望降低冷启动时间,预留模式是最佳方案。建议根据业务资源预算选择配置固定数量的预留实例策略,根据波峰波谷特性配置定时伸缩的预留实例策略、按指标伸缩的预留实例策略和智能伸缩的预留实例策略。
注意事项:
需注意不要依赖预留实例本身的初始化入口函数去执行一次性业务,以确保服务的稳定性和可靠性。
计费方式:
实例规格
- CPU实例
CPU实例包含以下实例规格,可以根据业务需求选择不同配置的实例。
表2 CPU实例规格 内存规格
代码包大小上限
函数执行时长上限
磁盘大小上限
128~32768MB
取值说明:必须为64的倍数。
- ZIP文件:解压后原始代码大小为1.5GB。
- 上传OBS桶中的文件:最大可上传300MB压缩后的代码包。
259200s
如需调用执行时间超过900秒的函数,请使用异步调用的方式。
取值说明:可选512MB或10GB,默认值为512MB。
- GPU实例
GPU实例包含以下实例规格,可以根据业务需求选择不同配置的实例。
表3 GPU实例规格 显卡类型
整卡显存
整卡算力(TFLOPS)
可选切分规格
是否支持按量模式
是否支持普通预留模式
是否支持闲置预留模式
NVIDIA T4
16GB
FP16算力
FP32算力
显存(MB)
内存规格(MB)
是
是
是
65
8
1024~16384(对应1GB~16GB)
取值说明:必须为1024 MB的倍数。
128~32768
取值说明:必须为64的倍数。