文档首页/ 云数据库 TaurusDB/ 用户指南/ 实例管理/ 查看TaurusDB实例整体运行情况
更新时间:2024-12-17 GMT+08:00
分享

查看TaurusDB实例整体运行情况

TaurusDB提供的实例总览页面可以帮助您查看该服务下所有数据库实例的整体运行情况,包括实例状态、活动告警和重点性能指标的诊断结果。

功能模块

实例总览页面从多个模块为用户展示实例的运行情况,各功能模块详情请参见表1

表1 功能说明

功能模块

说明

相关操作

实例状态

查看不同状态实例的数量。

请参见实例状态

活动告警

查看所有实例的活动告警记录,包含“告警中”“已触发”的状态。

请参见活动告警

智能诊断

基于运行数据结合智能算法对实例进行整体诊断,帮助您所见即所得了解实例的健康情况。

请参见智能诊断

实例状态

  1. 登录管理控制台
  2. 单击管理控制台左上角的,选择区域和项目。
  3. 在页面左上角单击,选择数据库 > 云数据库 TaurusDB
  4. 在左侧导航栏中选择“总览”,进入总览页面。
  5. 在实例状态区域查看当前账号下所有TaurusDB实例的状态。

    图1 查看实例状态

    表2 状态说明

    状态类别

    状态说明

    处理建议

    实例总数

    全部运行状态下,TaurusDB实例的总数。

    -

    异常

    运行状态为“异常”的TaurusDB实例总数。

    联系客服处理。

    冻结

    运行状态为“冻结”的TaurusDB实例总数。

    详见TaurusDB资源冻结/解冻/释放/删除/退订

    等待重启

    运行状态为“等待重启”的TaurusDB实例总数。

    说明:

    数据库参数修改后,有些参数需要重启实例才能生效,未重启前实例状态为“等待重启”。

    重启实例。

    正常

    运行状态为“正常”的TaurusDB实例总数。

    -

活动告警

根据设置的告警规则,可查看当前账号下所有TaurusDB实例的活动告警记录,包含“告警中(指标)”,“已触发(事件)”。

  1. 在活动告警页面右上方,单击“设置告警规则”,跳转到云监控服务页面。
    • 系统默认内置一条告警规则,支持修改、停用、删除等操作,详见修改告警规则
    • 单击“创建告警规则”,为数据库实例新建指标监控或事件监控告警规则。更多操作,详情参见创建告警规则和通知
  2. 在活动告警页面右上方,选择时间范围,查看告警详情。
    • 支持查看告警的时间窗为:近1小时、近6小时、近12小时、近1天、近1周、近1月。

    • 告警级别统计:查看告警总触发数和不同级别下各自触发数。告警级别包括:紧急、重要、次要、提示。
    • 告警总数TOP5实例:查看告警总数TOP5的实例,鼠标悬停可查看当前实例各级别的告警触发数。
    • 查看紧急告警详情:关于紧急告警的详细说明请参见表3
      表3 紧急告警说明

      类别

      说明

      实例名称

      触发告警的实例名称。刷新页面后,实时展示最新触发的告警详情。

      状态

      统计当前区域下所有实例的活动告警记录,包含“告警中(指标)”,“已触发(事件)”。

      • 告警中:监控指标数值达到告警配置阈值,资源正在告警中。
      • 已触发:监控的资源触发了告警策略中配置的事件。

      告警类型

      告警规则适用的告警类型。

      • 告警中(指标)
      • 已触发(事件)

      告警策略

      触发告警规则的告警策略。

      • 当告警类型选择指标监控时,是否触发告警取决于连续周期的数据是否达到阈值。例如:CPU使用率监控周期为5分钟,连续三个周期平均值≥80%,则触发告警。

        CPU使用率高的处理建议,请参见TaurusDB CPU使用率高的解决方法

      • 当告警类型选择事件监控时,触发告警具体的事件为一个瞬间的事件。例如:创建实例业务失败,则触发告警。

        支持的事件监控以及监控异常的处理建议,请参见事件监控支持的事件说明

      告警规则

      该条告警所在告警规则的名称/ID。

      最新更新时间

      该条告警的最新触发时间。

      操作

      单击“告警指标”,在右侧弹窗中,查看所选时间段内的指标监控视图。

智能诊断

基于运行数据结合智能算法对实例进行智能诊断,并对异常项提供具体的诊断结果以及优化建议。

图2 健康智能诊断

单击异常诊断项名称,查看异常实例以及相关监控指标的数据。

例如:出现“高压力请求”异常情况时,可以单击“高压力请求”查看出现异常的实例信息、对应的CPU使用率、CPU使用率趋势,还可以单击操作列的“诊断详情”,查看详细的诊断结果。

支持的诊断项以及诊断异常的处理建议,请参见表4

表4 智能诊断说明

诊断项

监控指标

指标说明

处理建议

相关案例

高压力请求

CPU使用率 (%)

该指标用于统计测量对象的CPU使用率。

  • 评估业务SQL的执行计划,添加索引避免全表扫描。
  • 扩容CPU规格,满足计算型业务需求。

TaurusDB CPU使用率高的解决方法

内存超限风险

内存使用率 (%)

该指标用于统计测量对象的内存使用率。

  • 扩容实例规格,满足业务需求。
  • 优化SQL,减少临时表等的使用。
  • 会话定期重连,及时释放session级别内存。

长事务产生大量临时表导致内存超限的解决办法

慢SQL高频

慢日志个数统计 (个/分钟)

该指标展示每分钟TaurusDB产生慢日志的数量。

  • 根据慢SQL的执行计划进行优化。
  • 扩容CPU规格,满足业务需求。

联合索引设置不当导致慢SQL的解决办法

连接数超限

数据库总连接数 (个)

该指标用于统计连接到TaurusDB服务器的总连接数。

  • 排查业务侧连接是否有效,优化实例连接,释放不必要的连接。
  • 实例规格偏小,需要对数据库进行规格扩容。

TaurusDB数据库连接数满的排查思路

当前活跃连接数 (个)

该指标用于统计当前活跃的连接数。

连接数使用率(%)

该指标用于统计当前已用的TaurusDB连接数占最大连接数的百分比。

相关文档