实例问题诊断和SQL分析功能简介
智能DBA(Database Administrator,数据库管理员)功能主要面向开发人员和数据库管理人员,提供数据库运维和智能诊断的可视化界面,提升数据库的运维能力与易用性。通过告警统计、资源使用情况、健康智能诊断、性能指标数据、容量预估等维度分析,帮助用户快速定位故障,实时了解实例运行情况。
如果要在RDS界面使用智能DBA助手功能,IAM子账号必须要有RDS FullAccess、DAS FullAccess、DAS Administrator、CES FullAccess权限。如果需要添加权限,请参见创建用户并授权使用RDS。
功能描述
使用场景
- 紧急恢复实例场景中,通过设置慢会话阈值帮助用户快速识别异常会话并手动结束该会话,使得数据库恢复正常,提高数据库的可用性。
- 新业务中出现并发数过高的SQL语句导致实例不稳定场景中,通过设置SQL限流规则功能控制并发数过高的SQL语句,保证实例的稳定性。
- 出现“磁盘空间满”问题时,通过查看磁盘空间功能实时了解磁盘空间概况与分布。您可以设置存储空间自动扩容,在实例存储空间达到阈值时,会触发自动扩容,详见存储空间自动扩容。
- 在突发流量过高、异常读写等业务场景中,通过配置自治限流功能控制活跃连接数来保障核心业务访问的可用性。
支持的区域
智能DBA助手功能支持的区域:华北-北京四、华北-乌兰察布一、华东-上海一、华南-广州、西南-贵阳一。
功能列表
智能DBA支持以下功能,详情请参见表1。
功能 |
描述 |
相关文档 |
---|---|---|
实例概览 |
提供数据库整体运行情况,包括告警统计、资源使用情况和重点性能指标,多方面实时展示实例的运行状态。基于运行数据结合智能算法对实例进行健康智能诊断,并对异常项提供解决方法与使用建议。 |
|
实时会话 |
提供当前数据库会话快照查询,并支持排序过滤展示。可基于用户、访问主机、库等多维度快速过滤识别到自定义慢SQL会话、活跃会话等。KILL会话与SQL限流功能应对紧急实例恢复,保障数据库的可用性。 |
|
实时性能 |
展示数据库实例各项关键指标,并提供日期对比功能,方便查看周期业务以及指标变化情况,及时发现异常。秒级监控有助于精准定位问题。 |
|
容量预估 |
数据库实例在使用过程中,当前磁盘空间数据与日志的占比以及历史上涨情况往往是用户关心的重点。智能DBA助手提供了容量预估功能,可以方便地查看磁盘空间概况与分布,并通过历史数据结合智能算法提供了空间预估等功能,尽早发现空间不足的情况并及时避免。此外还提供了智能扩容、表智能诊断、TOP50库表协助运维功能。 |
|
锁&事务 |
该模块从元数据锁以及InnoDB锁两个维度分析当前业务锁状态。通过元数据锁视图与InnoDB锁拓扑图管理阻塞事务,协助用户优化自身业务,减少锁冲突。 |
|
历史事务 |
该模块用来分析和发现数据库的大事务、长时间未提交的事务等历史信息。 |
|
慢SQL |
提供指定时间段内的慢SQL分析功能。从用户、IP、SQL模板等进行多维统计,展示统计结果并支持指定排序,识别慢SQL的精准来源,方便用户快速优化业务。 |
|
全量SQL |
在实例开启全量SQL的前提下,该模块基于全量SQL数据进行分析,并提供多维度的分析、搜索、过滤的能力,帮助用户全面洞察SQL,TOP SQL快速定位异常原因,保障数据库稳定运行。 |
|
SQL限流 |
针对新上业务不能及时发包优化的SQL和突发流量导致CPU等资源100%瓶颈的场景,SQL限流功能通过控制既定SQL规则的并发度协助业务侧及时流控,保证核心业务的稳定运行。 |
|
自治限流 |
该功能自动检测数据库的CPU利用率、活跃会话数等异常,根据业务优先级进行限流处理,保证核心业务的稳定运行。 用户可以根据业务情况,按照数据库或者用户进行限流。将非核心数据库或非核心用户业务配置为限流对象,可以保障核心业务不受影响。 |
|
诊断日报 |
对前一日实例状态的汇总展示,包括以上部分模块的重点指标:慢SQL分析、全量SQL分析、性能与磁盘分析。支持用户下载和订阅分析报告。建议每天定时对实例进行诊断,以保证实例上业务的正常运转。 |
|
异常快照 |
智能判断实例异常,记录会话快照、锁/事务等快照信息,方便后续问题定位。 |