方案概述
应用场景介绍
Gartner魔力象限将可观测性作为IT与运维自动化服务重点领域,认为可观测性进入第一轮行业景气高峰;同时,微服务、service mesh、Devops等技术导致系统复杂度快速提升,运维难度和人力成本激增,自动化、智能运维成为业界焦点。可观测性领域同传统监控、告警、应用性能管理(APM)等交叉,但是侧重全链路、全局质量、性能分析,智能提供优化建议,契合微服务时代复杂系统需求。
观测云方案主要面向互联网、零售、出海、ISV,其主要应用场景如下:
- 泛互联网客户,对多云、混合云、跨地域统一监控;
- 连锁商超、酒店、制造客户,对海量边缘节点的统一监控集中管理
- 电商客户,从页面下单、库存记录到订单物流的全链路数据追踪
- 金融、公共客户,对 App、小程序或网页的访问卡顿排障,可识别热点区域或性能卡点。
面向上述行业,总结了这类行业客户的目标画像和需求痛点,主要分为四个方面:
- 泛互联网:业务极度依赖线上应用,并对系统稳定性要求高(如健康码、电商)
- 游戏/零售等2C企业:在线应用频繁迭代,需兼顾稳定性和了解用户使用反馈(如游戏、社交App)
- 出海需求:因数据安全或数据出境安全法原因,必须替换海外品牌产品(各类企业,包括华为)
- 提供SaaS化服务的ISV:或提供本地化部署的ISV,客服需快速响应故障上报(如企服 SaaS)
观测云专注可观测性领域,对标datadog,完全自研产品和组件模块,实现真正统一多元数据存储、自研专属分析语言,单一的安全可靠数据采集器,运营健康度SLO模型,强表现力可二次开发数据面板,完全兼容OPLG数据标准,可面向异构多云提供服务。
方案架构
观测云是一款面向开发、运维、测试和业务团队的实时数据监测平台,统一满足云服务、云原生应用、云上业务的监测需求,快速实现基础设施、中间件、应用层和业务层可观测能力。包含基础设施监控、日志与指标监控、应用性能监控、用户访问与体验监控、异常监控、安全巡检、健康度检测、仪表盘和数据面板等多项可观测性解决方案,提供了统一数据采集、全面数据监控、无缝关联分析、高度可编程性,敏捷团队协作的优质服务体验
架构描述:
- 云原生:通过华为云容器引擎CCE + RDS(for Mysql)+ 分布式缓存DCS实现观测云产品云原生化,支撑客户业务的高并发、大规模场景,保证业务平稳健康运行。
- SaaS化:云化、服务化、SaaS的架构满足用户不断增长、数据不断扩大的性能要求,可支持业务正常运行。按照运维数据存量和分析量,完全按需弹性计费,实现0 成本启动,大大降低推广门槛。
- 方案采用RDS for Mysql、OBS、SFS存储支持Agent从客户服务器采集的不同类型的数据。
方案优势
观测云是一款面向开发、运维、测试和业务团队的实时数据监测平台,统一满足云服务、云原生应用、云上业务的监测需求,快速实现基础设施、中间件、应用层和业务层可观测能力。包含基础设施监控、日志与指标监控、应用性能监控、用户访问与体验监控、异常监控、安全巡检、健康度检测、仪表盘和数据面板等多项可观测性解决方案,提供了统一数据采集、全面数据监控、无缝关联分析、高度可编程性,敏捷团队协作的优质服务体验
- 场景普适性:实现IT系统的跨平台,跨系统,跨技术栈的全生命周期的全面可观测,优化IT团队的效能;一套系统,可支持异构多云或IDC+云的混合架构
- 一体化服务:统一采集数据agent,统一指标体系、统一运维数据存储,统一关联数据分析,统一数据看板,解决运维和监控数据孤岛,实现数据关联查询实现与多维分析,大大提升运维团队和开发团队的维护和系统优化效率
- 智能化运维:构建运维专家系统,快速定位性能瓶颈、程序崩溃、内存泄露、网络异常等电信场景,并支持二次开发,适配丰富用户场景,实现自动化运维,真正解决运维难题
- 生态亲和性:支持开源生态,与openmetrics等开源数据采集标准完全兼容
- 全按需付费:SAAS版本服务,按照运维数据存量和分析量,完全按需弹性计费,实现0 成本启动,大大降低推广门槛