更新时间:2024-11-29 GMT+08:00

使用HetuEngine SQL诊断功能

操作场景

HetuEngine QAS实例可对用户的SQL执行历史记录提供自动感知、自动学习、自动诊断服务,提升在线SQL运维能力,自动加速在线SQL分析任务,开启SQL诊断能力后,系统可实现如下能力:

  • 自动感知并向集群管理员展现不同时间周期范围内的租户级、用户级的SQL任务统计,帮助集群管理员快速预判业务运行状态和潜在风险。
  • 自动诊断出大SQL、慢SQL及相关提交信息,面向集群管理员多维度可视化呈现,同时提供大SQL、慢SQL的诊断与优化建议。

前提条件

  • 集群运行正常并至少安装一个QAS实例。
  • 已创建用于访问HetuEngine WebUI界面的用户,如Hetu_user,用户创建具体操作请参见创建HetuEngine用户

开启SQL诊断功能

HetuEngine的SQL诊断功能默认开启,可参考如下步骤配置其他常见参数或保持默认:

  1. Hetu_user用户登录FusionInsight Manager页面。
  2. 选择“集群 > 服务 > HetuEngine > 配置 > 全部配置 > QAS(角色) > SQL诊断“,参数“qas.sql.auto.diagnosis.enabled”为“true”表示开启SQL诊断功能,可根据业务需求配置SQL诊断推荐参数。
  3. 单击“保存”,保存配置。
  4. 单击“实例”,勾选所有QAS实例,选择“更多 > 重启实例”,输入密码重启QAS所有实例使参数生效。

查看SQL诊断结果

  1. Hetu_user用户登录FusionInsight Manager页面。
  2. 选择“集群 > 服务 > HetuEngine”,进入HetuEngine服务页面。
  3. 在概览页签下的“基本信息”区域单击“HSConsole WebUI”后的链接,进入HSConsole界面。
  4. 单击“SQL运维”,可查看如下SQL诊断结果:

    • 在“概览”页面,可查看历史任务的整体运行状况,包括:查询分段耗时分布图、查询用户分布图、SQL提交总数、SQL执行成功率、SQL平均响应时间、查询个数、平均执行耗时、平均等待耗时。
    • 在“慢查询分布”页面,用户可查看历史任务的慢查询分布情况,包括:
      • 慢SQL统计:统计各个租户的慢查询(查询时间大于慢查询阈值)提交个数。
      • 慢查询TOP用户请求统计列表:统计各个用户的慢查询统计明细,支持列表排序和全部导出功能。
    • 在“慢查询列表”页面,用户可查看历史任务的慢查询列表、诊断结果和优化建议,支持导出查询结果。

      历史统计信息的有效期取决于HSConsole实例的JVM内存大小,最多不超过60天。