调用链服务功能介绍
调用链服务(NUWA Trace)是一款应用程序性能监控(APM)产品,提供服务拓扑、服务轨迹、轨迹洞察三大特性,以实现监控并管理服务的故障和性能,帮助业务实现全栈式性能监控和端到端全链路追踪诊断,让应用运维简单高效。
应用场景
- 故障定位:在分布式、微服务化架构下,一次请求往往涉及到多个服务,这些服务有可能是多个团队负责的。一旦出问题,需要多个团队一起定位,问题处理效率非常低。
- 性能分析:当用户反馈网站出现卡顿现象,很难快速发现问题瓶颈。用户终端到服务端的网络问题,服务端负载过高导致响应变慢,还是数据库压力过大?
- 架构梳理:随着业务不断增长,业务逻辑变得逐渐复杂,很难从代码层面去梳理应用的依赖,以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理就变得更加困难。
- 容量评估:如何对海量资源进行整体规划?“春晚红包”、“双11促销”的准备过程中,需要为每个应用准备多少台机器?
功能介绍
功能 |
功能说明 |
---|---|
概览 |
提供服务健康状况的关键指标展示,包括请求数、错误数、慢请求、慢SQL,快速发现系统问题。 |
调用链 |
提供多维查询调用链能力,并展示单个调用链详情、瀑布图及其调用链聚合能力。 |
服务监控 |
从微服务、节点维度对服务进行统计分析,接口指标、JVM监控、数据库、中间件监控、异常、错误、调用链等方面数据统计和查看。 |
服务拓扑 |
从节点维度对应用进行统计分析,包括上下游拓扑图、总体接口指标、JVM、主机、数据库、异常、错误、调用链等方面数据统计和查看。 |
性能剖析 |
提供线程粒度的CPU耗时和每类线程数量的统计,并且每5分钟记录一次线程的方法栈并聚合,可真实还原代码执行过程,帮助您快速定位线程问题。 |
配置管理 |
采集管理:配置调用链的采集策略,包括插件配置、自定义参数、自定义状态码、采样白名单、场景标签等。 日志空间配置:为微服务关联监控服务ServiceInsight的日志空间。 事件规则:支持通过配置事件规则来检测JVM指标、线程池指标等出现的异常事件。 访问密钥:支持新增访问密钥,用于接入NUWA Trace Agent。 |
事件中心 |
查看事件规则匹配到的事件,同时可以对事件进行关闭或删除。 |
Agent管理 |
展示服务接入使用的NUWA Trace Agent信息。 |
使用流程
使用调用链服务进行链路追踪诊断的流程如图1所示。
- 开通AppStage调用链服务:首次进入调用链服务需要先开通调用链服务。
- 新增访问密钥:新增访问密钥用于接入NUWA Trace Agent使用。
- 接入NUWA Trace Agent:使用javaagent方式接入NUWA Trace Agent,采集调用链类数据及指标类数据。
- 查看调用链、拓扑、监控等数据:使用NUWA Trace Agent采集数据后,可以在调用链服务查看数据。
如需配置采集插件、参数等内容,请参见管理采集配置。
基本概念
基本概念 |
说明 |
---|---|
Trace |
一次调用的完整记录,由多个Span组成。 |
Span |
一次调用中的某个节点或者步骤,类似于一层堆栈信息。Span之间存在父子或并列关系来表明Span在整个调用中的生命周期。 |
TraceId |
调用链的跟踪号。 |
SpanId |
节点或者步骤的Id。 |
ParentId |
节点或者步骤的父SpanId。 |
探针 |
探针通过字节码增强技术进行调用埋点,生成数据。 |
拓扑 |
拓扑是对应用间调用关系和依赖关系的可视化展示。 |