查看实例监控页面
操作场景
在HetuEngine的WebUI界面,可以查看指定业务的详细信息,包括每个SQL的执行情况。
前提条件
已创建好用于访问HetuEngine WebUI界面的管理员用户,用户创建具体操作请参见创建HetuEngine用户。
操作步骤
- 使用可访问HetuEngine WebUI界面的管理员用户登录FusionInsight Manager,选择“集群 > 服务 > HetuEngine”,进入HetuEngine服务页面。
- 在概览页签下的“基本信息”区域单击“HSConsole WebUI”后的链接,进入HSConsole界面。
- 单击“计算实例”,单击待操作实例对应的租户名。
- 单击“WebUI”列的“LINK”链接,将在新页面展示计算实例任务监控页面信息。首次进入为“CLUSTER OVERVIEW”页面,可查看计算实例任务监控页面信息。
表1 指标含义 指标
指标含义
Running Queries
当前实例并发执行的任务
Active Workers
当前实例中的有效Worker数量
ROWS/SEC
当前实例每秒处理的数据行数
Queued Queries
当前实例中等待队列中等待执行的任务数
RUNNABLE DRIVERS
当前实例中正在RUNNING的DRIVERS数量
BYTES/SEC
当前实例中每秒读取的数据量
Blocked Queries
当前实例中由于资源或其他原因被阻塞的任务数
RESERVED MEMORY (B)
当前实例中使用正在RUNNING状态的任务占用的内存
WORKER PARALLEISM
当前实例每秒每个Worker平均使用的CPU时间片时间
Avg CPU cycles per worker
当前实例每个Worker的平均CPU周期
- 通过“QUERY DETAILS”页面的State选项可以对查询任务进行筛选。
表2 State含义 State
含义
Running
查看当前正在运行中的任务
Queued
查看等待队列中等待执行的任务
Finished
查看执行完成的任务
Failed
查看执行失败的任务,并可以按照任务失败原因进行过滤
- 单击任务编号,可以进一步查看任务的基本信息、资源占用情况、Stages划分、 Tasks划分等信息,对于失败的任务,也可以在查询详情页面查看相关日志。
图1 查看任务详情
图2 任务资源使用情况
图3 任务Stages划分
表3 Stages监控信息 监控项
含义
SCHEDULED TIME SKEW
代表当前Stage节点并发任务被调度的时间
CPU TIME SKEW
可以判断是否存在Stage阶段并发任务是否存在计算倾斜
图4 Tasks划分(单击每个stage右边的小三角可见)
表4 Tasks监控项 监控项
含义
ID
代表多阶段并发执行Task的ID,格式为StageID:TaskID
Host
代表当前任务在哪个Worker节点执行
State
当前任务执行的状态,主要状态PLANNED、RUNNING、FINISHED、CANCELED、ABORTED、FAILED
Rows
Task读取的总数据条数,单位为千(k)、百万(M),通过分析相同Stage阶段不同Task读取的条数可以快速判断当前任务是否存在数据倾斜
Rows/s
Task每秒钟读取的数据条数,通过分析相同Stage阶段不同Task每秒中读取数据条数可以快速判断节点是否存在网络带宽差异,定位是否节点网卡存在问题
Bytes
Task读取的数据量
Bytes/s
Task每秒中读取的数据量
Elapsed
Task执行时长
CPU Time
Task使用的CPU时间
Mem
Task内存
Peak Mem
Task峰值内存
- 单击“Host”的链接,可以查看每个节点task资源占用情况。
图5 Task节点资源占用情况
表5 节点资源监控指标 指标名称
含义
Node ID
节点ID
Heap Memory
最大堆内存大小
Processors
处理器个数
Uptime
运行时长
External Address
外部地址
Internal Address
内部地址
Process CPU Utilization
物理CPU使用率
System CPU Utilization
系统CPU使用率
Heap Utilization
堆内存使用率
Non-Heap Memory Used
非堆内存使用大小
Memory Usage Pool
当前Worker节点内存池大小