更新时间:2024-06-11 GMT+08:00

Cloud Eye监控集群

功能说明

用户需要查看集群的监控指标信息时,可以通过云监控(Cloud Eye)确认集群各项指标情况。通过监控集群运行时的各项指标,用户可以识别出数据库集群状态异常的时间段,然后在数据库日志中,分析可能存在问题的活动,从而优化数据库性能。本章节定义了数据仓库服务上报云监控服务的监控指标的命名空间、监控指标列表和维度定义。用户可以通过云监控服务提供的管理控制台或API接口来检索数据仓库服务产生的监控指标和告警信息,详情请参见云监控服务的《用户指南》和《API参考》。

本章节包含如下内容:

命名空间

SYS.DWS

集群监控指标

通过云监控提供的数据仓库服务相关监控指标,用户可以获取有关集群运行状况和性能的信息,并深入了解节点级别的对应信息。

数据仓库服务相关监控指标,具体请参见表1

表1 数据仓库服务支持的监控指标

指标ID

指标名称

指标含义

取值范围

测量对象

监控周期(原始指标)

dws001_shared_buffer_hit_ratio

缓存命中率

该指标是指在系统中请求数据时,请求到的数据已经存在于缓存中的比率。即缓存中已经存在的数据量与请求的总数据量之比。缓存命中率越高,说明系统的缓存利用率越高,请求数据时需要从磁盘或网络中读取的次数就越少,系统响应速度就越快。以百分比为单位。

0%~100%

数据仓库集群

4分钟

dws002_in_memory_sort_ratio

内存中排序比率

该指标用于表示排序算法所使用的额外内存空间与排序数据所占用的内存空间的比值来表示。例如,在归并排序中,归并缓冲区的大小通常是排序数据大小的一部分,因此归并排序的内存中排序比率通常在10%到50%之间。以百分比为单位。

0%~100%

数据仓库集群

4分钟

dws003_physical_reads

文件读取次数

该指标用于表示读取数据库文件的累计次数。

> 0

数据仓库集群

4分钟

dws004_physical_writes

文件写入次数

该指标用于表示写入数据库文件的累计次数。

> 0

数据仓库集群

4分钟

dws005_physical_reads_per_second

每秒文件读取次数

该指标用于表示每秒读取数据库文件的次数。

≥ 0

数据仓库集群

4分钟

dws006_physical_writes_per_second

每秒文件写入次数

该指标用于表示每秒写入数据库文件的次数。

≥ 0

数据仓库集群

4分钟

dws007_db_size

数据量大小

该指标用于表示数据库中所有数据总量大小。

单位:兆字节(MB)

≥0MB

数据仓库集群

4分钟

dws008_active_sql_count

活跃SQL数

该指标用于表示数据库当前活动的SQL个数。

≥ 0

数据仓库集群

4分钟

dws009_session_count

会话数

该指标用于表示数据库当前访问的连接个数。

≥ 0

数据仓库集群

4分钟

dws010_cpu_usage

CPU使用率

该指标用于统计每个集群节点的CPU使用率,以百分比为单位。

0%~100%

数据仓库节点

1分钟

dws011_mem_usage

内存使用率

该指标用于统计每个集群节点的内存使用率,以百分比为单位。

0%~100%

数据仓库节点

1分钟

dws012_iops

IOPS

该指标用于统计每个集群节点每秒处理的I/O请求数量。

≥ 0

数据仓库节点

1分钟

dws013_bytes_in

网络输入吞吐量

该指标用于统计每秒从网络输入每个集群节点的数据总量。

单位:字节/秒

≥ 0字节/秒

数据仓库节点

1分钟

dws014_bytes_out

网络输出吞吐量

该指标用于统计从每个节点每秒发送到网络的数据总量。

单位:字节/秒

≥ 0字节/秒

数据仓库节点

1分钟

dws015_disk_usage

磁盘利用率

该指标用于统计每个集群节点的磁盘使用情况,以百分比为单位。

0%~100%

数据仓库节点

1分钟

dws016_disk_total_size

磁盘总大小

该指标用于统计每个集群节点的数据磁盘总大小。

单位:吉字节(GB)

100GB~2000GB

数据仓库节点

1分钟

dws017_disk_used_size

磁盘使用量

该指标用于统计每个集群节点的数据磁盘已用大小。

单位:吉字节(GB)

0GB~3600GB

数据仓库节点

1分钟

dws018_disk_read_throughput

磁盘读吞吐量

该指标用于统计集群节点数据磁盘每秒读取的数据量。

单位:字节/秒

≥ 0字节/秒

数据仓库节点

1分钟

dws019_disk_write_throughput

磁盘写吞吐量

该指标用于统计集群节点数据磁盘每秒写入的数据量。

单位:字节/秒

≥ 0字节/秒

数据仓库节点

1分钟

dws020_avg_disk_sec_per_read

磁盘读耗时

该指标用于统计集群节点数据磁盘每次读取数据的平均耗时。

单位:秒

> 0秒

数据仓库节点

1分钟

dws021_avg_disk_sec_per_write

磁盘写耗时

该指标用于统计集群节点数据磁盘每次写入数据的平均耗时。

单位:秒

> 0秒

数据仓库节点

1分钟

dws022_avg_disk_queue_length

磁盘平均队列长度

该指标用于统计每个集群节点数据磁盘平均的I/O队列长度。

≥ 0

数据仓库节点

1分钟

dws_024_dn_diskio_util

DN实例I/O使用率

该指标用于统计集群DN实例磁盘平均I/O使用率

0%~100%

数据仓库实例

1分钟

维度

Key

Value

datastore_id

数据仓库集群ID

dws_instance_id

数据仓库节点ID

查看集群监控和节点监控信息

  1. 登录GaussDB(DWS) 管理控制台,进入“集群 > 专属集群 ”页面。
  2. 查看集群信息:在集群列表中,在指定集群所在行,单击“查看监控指标”,打开云监控管理控制台。默认显示的是集群监控信息。

    用户可以根据需要,选择指定的监控指标名称以及时间范围,从而显示监控指标的性能曲线。

  3. 查看节点信息:单击可回到云监控管理控制台,默认显示“数据仓库节点”页签,可以从集群节点维度查看每个节点的指标。

    用户可以根据需要,选择指定的监控指标名称以及时间范围,从而显示监控指标的性能曲线。

    云监控也支持多个节点间的监控指标对比,具体操作请参见多节点间的监控指标对比

多节点间的监控指标对比

  1. 在云监控管理控制台的左侧导航栏中,选择总览 > 监控面板
  2. “监控面板”页面,单击“创建监控面板”,在弹出对话框中,输入“名称”后,单击“确定”
  3. “监控面板”页面,单击右上角的“添加监控视图”
  4. 在弹出的“添加监控视图”窗口中,配置标题和监控项。

    单击“添加监控项”可以添加多个监控指标。

    以对比两个节点间的CPU使用率为例,参数设置如下表所示。

    表2 配置样例

    参数名

    样例值

    资源类型

    数据仓库服务

    维度

    数据仓库节点

    监控对象

    dws-demo-dws-cn-cn-2-1

    dws-demo-dws-cn-cn-1-1

    dws-demo-dws-dn-1-1

    监控指标

    CPU使用率

  5. 单击“确定”

    添加成功后,可在“监控面板”区域看到对应的监控视图。鼠标移至监控视图单击右上角的,可放大监控视图,查看详细的指标对比数据。