查看TaurusDB实例整体运行情况
TaurusDB提供的实例总览页面可以帮助您查看该服务下所有数据库实例的整体运行情况,包括实例状态、活动告警和重点性能指标的诊断结果。
功能模块
实例总览页面从多个模块为用户展示实例的运行情况,各功能模块详情请参见表1。
实例状态
- 登录管理控制台。
- 单击管理控制台左上角的,选择区域和项目。
- 在页面左上角单击,选择 。
- 在左侧导航栏中选择“总览”,进入总览页面。
- 在实例状态区域查看当前账号下所有TaurusDB实例的状态。
图1 查看实例状态
表2 状态说明 状态类别
状态说明
处理建议
实例总数
全部运行状态下,TaurusDB实例的总数。
-
异常
运行状态为“异常”的TaurusDB实例总数。
联系客服处理。
冻结
运行状态为“冻结”的TaurusDB实例总数。
等待重启
运行状态为“等待重启”的TaurusDB实例总数。
说明:数据库参数修改后,有些参数需要重启实例才能生效,未重启前实例状态为“等待重启”。
重启实例。
正常
运行状态为“正常”的TaurusDB实例总数。
-
活动告警
根据设置的告警规则,可查看当前账号下所有TaurusDB实例的活动告警记录,包含“告警中(指标)”,“已触发(事件)”。
- 在活动告警页面右上方,单击“设置告警规则”,跳转到云监控服务页面。
- 在活动告警页面右上方,选择时间范围,查看告警详情。
- 支持查看告警的时间窗为:近1小时、近6小时、近12小时、近1天、近1周、近1月。
- 告警级别统计:查看告警总触发数和不同级别下各自触发数。告警级别包括:紧急、重要、次要、提示。
- 告警总数TOP5实例:查看告警总数TOP5的实例,鼠标悬停可查看当前实例各级别的告警触发数。
- 查看紧急告警详情:关于紧急告警的详细说明请参见表3。
表3 紧急告警说明 类别
说明
实例名称
触发告警的实例名称。刷新页面后,实时展示最新触发的告警详情。
状态
统计当前区域下所有实例的活动告警记录,包含“告警中(指标)”,“已触发(事件)”。
- 告警中:监控指标数值达到告警配置阈值,资源正在告警中。
- 已触发:监控的资源触发了告警策略中配置的事件。
告警类型
告警规则适用的告警类型。
- 告警中(指标)
- 已触发(事件)
告警策略
触发告警规则的告警策略。
- 当告警类型选择指标监控时,是否触发告警取决于连续周期的数据是否达到阈值。例如:CPU使用率监控周期为5分钟,连续三个周期平均值≥80%,则触发告警。
CPU使用率高的处理建议,请参见TaurusDB CPU使用率高的解决方法。
- 当告警类型选择事件监控时,触发告警具体的事件为一个瞬间的事件。例如:创建实例业务失败,则触发告警。
支持的事件监控以及监控异常的处理建议,请参见事件监控支持的事件说明。
告警规则
该条告警所在告警规则的名称/ID。
最新更新时间
该条告警的最新触发时间。
操作
单击“告警指标”,在右侧弹窗中,查看所选时间段内的指标监控视图。
智能诊断
基于运行数据结合智能算法对实例进行智能诊断,并对异常项提供具体的诊断结果以及优化建议。
单击异常诊断项名称,查看异常实例以及相关监控指标的数据。
例如:出现“高压力请求”异常情况时,可以单击“高压力请求”查看出现异常的实例信息、对应的CPU使用率、CPU使用率趋势,还可以单击操作列的“诊断详情”,查看详细的诊断结果。
支持的诊断项以及诊断异常的处理建议,请参见表4。
诊断项 |
监控指标 |
指标说明 |
处理建议 |
相关案例 |
---|---|---|---|---|
高压力请求 |
CPU使用率 (%) |
该指标用于统计测量对象的CPU使用率。 |
|
|
内存超限风险 |
内存使用率 (%) |
该指标用于统计测量对象的内存使用率。 |
|
|
慢SQL高频 |
慢日志个数统计 (个/分钟) |
该指标展示每分钟TaurusDB产生慢日志的数量。 |
|
|
连接数超限 |
数据库总连接数 (个) |
该指标用于统计连接到TaurusDB服务器的总连接数。 |
|
|
当前活跃连接数 (个) |
该指标用于统计当前活跃的连接数。 |
|||
连接数使用率(%) |
该指标用于统计当前已用的TaurusDB连接数占最大连接数的百分比。 |