更新时间:2024-12-02 GMT+08:00
查看集群风险项
启动检测任务后,系统会开始诊断集群,可在智能运维列表查看集群存在的风险项详情。
前提条件
已启动检测任务,详情请见启动检测任务。
检测项
检测任务会从如下项目对集群进行检测,如存在风险,可在智能运维列表查看风险项。
- 检查当前时刻集群的健康状态,其中red表示有主分片未分配,yellow表示有副分片未分配,green表示所有分片均已分配。
- 检测集群节点数与AZ(可用区)数,判定Elasticsearch分布式集群的高可用性。
- 检测集群索引是否开启副本,未设置副本的索引在节点发生故障后可能导致索引不可用,本地盘集群未设置副本会有数据丢失的风险。
- 检测集群是否存在.kibana索引冲突。
- 检测节点磁盘用量百分比,节点磁盘存储过大可能导致节点无法分配新索引分片并影响集群性能。
- 检测集群数据节点/冷数据节点的存储用量是否均衡,不均衡的存储用量分布可能导致集群负载不均,读写延迟增加。
- 连续5分钟检测当前集群是否有节点脱离或不可用。
- 检测节点分片数量是否过多,单节点分片数量过多会消耗大量节点资源,读写请求时延增加,集群元数据更新缓慢等。
- 检测所有分片大小,分片太大可能导致查询性能下降,节点内存消耗增加,影响扩缩容以及节点故障时分片的恢复速率等。
- 检测当前集群是否存在可升级的版本。
- 检测集群7天内是否有快照备份失败,或7天内无快照备份记录。
操作步骤
- 登录云搜索服务管理控制台。
- 在集群管理页面,单击集群名称,跳转至该集群基本信息页面。
- 选择“智能运维”。
- 在智能运维列表页面,选择已启动的检测任务。单击任务名称左侧的,可查看检测任务的“创建时间”、“摘要”、“ID”以及检测任务所发现的“风险项”。
单击风险项左侧,可查看风险项详情,包括检测项、风险描述、风险建议。
您可以根据风险建议及时处理集群所存在的风险。
图1 风险项
父主题: 智能运维