更新时间:2023-06-20 GMT+08:00

配置集群监控

云搜索服务支持通过云监控服务CES对已创建成功的集群进行日常监控。配置集群监控后,就可以在CES管理控制台直观查看集群的监控指标数据。

配置集群监控的操作流程:

  1. 配置告警规则:根据实际业务需要对监控指标设置自定义告警规则,当监控指标超过设置的阈值时,会以邮箱、HTTP、HTTPS等方式通知您。
  2. 配置监控对象:为集群或集群中某个节点配置监控指标。
  3. 查看监控指标:您可以选择不同的监控时间周期,查看监控指标数据变化情况。

前提条件

  • 集群处于“可用”或“处理中”状态。
  • 集群正常运行时长大于10分钟。

推荐配置的监控指标

  • 监控集群的cpu、jvm使用情况,推荐重点配置如下监控指标:平均JVM堆使用率、最大JVM堆使用率、平均CPU使用率、最大CPU利用率
  • 监控集群的写入、查询延迟和吞吐量情况,推荐重点配置如下监控指标:平均索引延迟、平均索引速率、平均查询延迟、平均查询速率
  • 监控集群的写入、查询的排队队列和拒绝情况,推荐重点配置如下监控指标:Write队列中总排队任务数、Search队列中总排队任务数、Write队列中总的已拒绝任务数、Search队列中总的已拒绝任务数

配置告警规则

  1. 登录云监控服务CES管理控制台。
  2. 左侧导航栏选择“告警 > 告警规则”,进入告警规则列表页面。
  3. “资源类型”列,筛选“云搜索服务”,查看是否有满足要求的告警规则。
    图1 查看告警规则

    如果没有,请参考云监控服务CES的“创建告警规则和通知”章节,新建CSS服务的告警规则。其中,“资源类型”“维度”参数的填写说明请参见表1,其他参数可以根据CES服务的参数说明自定义。

    表1 告警内容的配置说明

    参数

    参数解释

    配置说明

    资源类型

    配置告警规则监控的服务名称。

    选择云搜索服务

    维度

    用于指定告警规则对应指标的维度名称。

    CSS支持2个维度,根据实际需要选择维度。

    • CSS集群:以集群维度指定告警规则。
    • CSS集群 - 云服务节点:以集群中的某个节点维度指定告警规则。

配置监控对象

  1. 参考云监控服务CES的“创建监控面板”章节,创建一个监控面板。如果已有监控面板,可以跳过该步骤。
  2. 参考云监控服务CES的“添加监控视图”章节,添加CSS监控视图。

    其中,“资源类型”“维度”参数的填写说明请参见表2,其他参数可以根据CES服务的参数说明自定义。

    表2 监控视图的配置说明

    参数

    参数解释

    配置说明

    资源类型

    添加监控视图的服务名称。

    选择云搜索服务

    维度

    指定监控的维度名称。

    CSS支持2个维度,根据实际需要选择维度。

    • CSS集群:以集群维度监控。
    • CSS集群 - 云服务节点:以集群中的某个节点维度监控。

查看监控指标

  1. 登录云搜索服务管理控制台。
  2. 选择目标集群,单击操作列“监控信息”查看监控指标。
    图2 查看监控信息
  3. 选择待查看的时间段页签。
  4. 查看监控指标数据。