函数工作流冷启动优化实践
Serverless按需付费、自动弹性伸缩、屏蔽复杂性等特征使其逐渐成为下一代云计算新范式。但是在Serverless架构带来极大便利的同时,在实时性要求较高的应用场景下,冷启动将是面临的一个切实的挑战。当使用Serverless构建Web服务时,冷启动和Web服务初始化时间一共超过了5秒钟,那么无疑将会使您网站的用户体验大打折扣,因此设法减少冷启动时间,提高终端用户的使用体验,是您在构建无服务器架构时亟待解决的问题。
Serverless实例的生命周期可以分为三个阶段:
- 初始化:在此阶段,FunctionGraph会尝试解冻之前的执行环境,若没有可解冻的环境,FunctionGraph会进行资源创建,下载函数代码,初始化扩展和Runtime,然后开始运行初始化代码(主程序外的代码)。
- 执行:在此阶段,实例接收事件后开始执行函数。函数运行到完成后,实例会等待下个事件的调用。
- 关闭:如果FunctionGraph函数在一段时间内没有接收任何调用,则会触发此阶段。在关闭阶段,Runtime关闭,然后向每个扩展发送一个关闭事件,最后删除环境。
当触发FunctionGraph时,若当前没有处于激活阶段的函数实例可供调用,则会下载函数的代码并创建一个函数的执行环境。从事件触发到新的FunctionGraph环境创建完成这个周期通常称为 “冷启动时间”。在Serverless架构中,冷启动问题是无法避免的。
目前FunctionGraph已经对系统侧的冷启动做了大量优化,针对用户侧请参考如下方案。
选择合适的内存
在请求并发量一定的情况下,函数内存越大,分配的CPU资源相应越多,一般冷启动表现越优。
快照冷启动
Java应用冷启动速度慢的问题尤为突出。华为云FunctionGraph创新提出的基于进程级快照的冷启动加速解决方案,致力于在用户无感知(无需/少量进行代码适配)的前提下,帮助用户突破冷启动的性能瓶颈。本优化方案直接从应用初始化后的快照进行运行环境恢复,跳过复杂的框架、业务初始化阶段,从而显著降低Java应用的启动时延,实测性能提升达90%+。
用户使用Java函数可以打开冷启动快照加速的配置开关,详情请参见配置快照式冷启动。华为云FunctionGraph会预先执行函数对应的初始化代码,获取其初始化执行上下文环境的快照,并进行加密缓存。后续调用该函数并触发冷启动扩容时,会直接从提前初始化后的应用快照来恢复执行环境,而非重新走一遍初始化流程,以此达到极大提升启动性能的效果。
精简代码大小和镜像瘦身
由于FunctionGraph在冷启动的时候会下载函数代码,下载代码的过程也会影响启动时间。如果代码包太大,下载时间将会变长,导致增加FunctionGraph的启动时间;如果使用自定义镜像函数,镜像越大,启动时间也会越长。所以,为了降低冷启动时间,可以对应用程序进行瘦身,比如在程序中移除不必要的代码、减少不必要的第三方库依赖等。例如,在Node.js中执行“npm prune”命令、在Python中执行“autoflake”。另外,某些第三方库中可能会包含测试用例源代码、无用的二进制文件和数据文件等,删除无用文件可以降低函数代码下载和解压时间。
公共依赖包加速
在编写应用程序时,往往会引入第三方依赖库,尤其是Python语言。在冷启动过程中会下载所需的依赖包,若依赖包太大会直接增加启动时间。FunctionGraph提供公共依赖包和私有依赖包两种模式,针对公共依赖包,FunctionGraph会预先下载到执行节点中,减少依赖包的下载时间。所以建议优先使用FunctionGraph提供的公共依赖包,尽量减少私有依赖的使用。