什么是云监控服务?
云监控服务为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。云监控服务架构图如图1所示。
主要功能
云监控服务主要具有以下功能:
- 自动监控:
云监控服务不需要开通,在创建弹性云服务器等资源后监控服务会自动启动,您可以直接到云监控服务查看该资源运行状态并设置告警规则。
- 主机监控:
通过在弹性云服务器或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁盘等40余种监控指标。有关主机监控的更多信息,请参阅主机监控简介。
- 灵活配置告警规则:
对监控指标设置告警规则时,支持对多个云服务资源同时添加告警规则。告警规则创建完成后,可随时修改告警规则,支持对告警规则进行启用、停止、删除等灵活操作。有关告警规则的更多信息,请参阅告警规则简介。
- 实时通知:
通过在告警规则中开启消息通知服务,当云服务的状态变化触发告警规则设置的阈值时,系统通过短信、邮件、HTTP、HTTPS、FunctionGraph(函数)、FunctionGraph(工作流)、企业微信、钉钉、飞书或Welink等多种方式实时通知用户,让用户能够实时掌握云资源运行状态变化。有关告警通知的更多信息,请参阅告警通知。
- 监控面板:
为用户提供在一个监控面板跨服务、跨维度查看监控数据,将用户关注的重点服务监控指标集中呈现,既能满足您总览云服务的运行概况,又能满足排查故障时查看监控详情的需求。有关监控面板的更多信息,请参阅我的看板简介。
- 资源分组:
资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。有关资源分组的更多信息,请参阅资源分组简介。
- 事件监控:
事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。有关事件监控的更多信息,请参阅事件监控简介。
- 数据转储:
当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。
介绍视频