PERF04-05 应用性能数据采集
- 风险等级
中
- 关键策略
应用程序的性能数据(吞吐量、延迟和完成时间),通常需要通过代码采集,例如嵌入代码片段或将工具集成到应用程序代码中。通过应用的性能数据,可以识别性能瓶颈、评估系统行为、识别可用性风险、规划容量等指标。
常用应用性能监控策略有:
- APM 工具:可用使用云上APM 工具或者开源的APM工具和分析性能数据(指标、日志、调研链)
- 使用基于日志调用链框架:这些框架具备日志生成、日志格式化、日志上下文关联分析登能力。 通过框架引入到代码库中,可以在运行时采集相关的性能数据。
- 自定义检测:仅当平台指标不足时,才建议开发人员可以添加自定义代码采集独有的性能指标。
- 使用业界可观测的标准。请考虑使用围绕业界标准构建的工具,例如OpenTelemetry。
建议:使用分布式的调用链技术,可以识别多个服务和组件之间请求链路;通过收集调用链数据实现数据流端到端的分析,产品阻塞瓶颈点或者效率低下的请求片段,从而进行针对性的优化。
- 相关云服务和工具
- 应用运维管理 AOM
- 应用性能管理 APM
- 云日志服务LTS