使用AppStage运维中心进行应用监控方案概述
应用场景
随着数字化进程加速,企业应用规模呈指数级增长,运维体系面临的问题也日益突出。
- 应用的快速迭代与现网业务稳定性之间存在冲突,应用发布周期短,版本可能未经过充分的现网验证。
- 运维平台基于开源软件或者各类分散工具构建,各工具能力参差不齐,缺乏统一的数据接入、监控、诊断、数据治理体系。
- 系统可用性依赖全栈可观测,运维人员需要被动变主动,利用数据实时监控分析系统的性能、可靠性和运行状态,及时发现问题,精准定位问题。
- 外部安全攻击渗透频率日趋增多,攻击技术手段越发高超,数据泄露风险大。
本章节介绍如何通过AppStage运维中心对应用资源到业务进行监控,提高运维效率、提升运维质量。通过AppStage运维中心的全栈监控能力,保障应用高可用,业务稳定运行。
约束与限制
- 当前仅支持x86类型主机安装OpsAgent并接入运维中心,不支持arm类型主机。
- 支持接入的Linux主机操作系统如表1所示,其余类型的Linux主机无法接入运维中心。
- 支持接入的Windows主机操作系统包括Windows Server 2012、Windows Server 2016、Windows Server 2019和Windows Server 2022,其余类型的Windows主机无法接入运维中心。
操作流程
本文档介绍如何通过AppStage运维中心对应用资源到业务进行监控,流程如图1所示。
序号 |
步骤 |
说明 |
---|---|---|
1 |
使用AppStage运维中心进行应用监控之前,需要先准备相关的资源。 |
|
2 |
购买AppStage运维中心,并配置相应的初始数据,包括产品、服务、用户等数据。 |
|
3 |
将已准备的资源接入至运维中心,进行统一管理。 |
|
4 |
使用日志、报表、告警等功能进行应用监控 |
配置虚拟机日志接入并查看日志:日志接入并创建导流任务后,可以对已接入的日志进行检索,定位业务异常问题。 |
配置主机监控并查看主机监控报表:通过为主机绑定监控模板,采集主机监控数据,监控主机状态。 |
||
接入CES指标并生成业务报表:将CES中的指标数据接入运维中心,通过报表呈现接入指标数据的变化。 |
||
创建业务指标并开发业务报表:创建指标并进行业务报表开发,配置后可以查看业务报表监控,实时监控业务数据。 |
||
使用异常检测完成告警配置并查看告警:通过监控服务提供的异常检测功能,判断实际数据和预测值偏差,偏差达到一定程度则认为发生异常,生成告警并上报至告警系统。 |
||
配置主机告警并查看生成的告警:通过对采集的主机监控数据进行判断,及时掌握主机状态。 |