文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-45429 ClickHouse扩容节点上同步表元数据失败
更新时间:2024-08-13 GMT+08:00
分享

ALM-45429 ClickHouse扩容节点上同步表元数据失败

本章节仅适用于MRS 3.1.2及之后版本。

告警解释

ClickHouse扩容时创建分布式表对应的本地表失败时产生该告警。

告警属性

告警ID

告警级别

是否自动清除

45429

重要

告警参数

参数名称

参数含义

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

查询分布式表失败。

可能原因

扩容过程中已有节点停止或故障。

处理步骤

  1. 在FusionInsight Manager首页,选择“集群 > 服务 > ClickHouse > 实例”。
  2. 查看是否有停止、退服或故障的实例。

    • 是,执行3
    • 否,执行4

  3. 启动实例,或修复实例故障,直到所有实例运行状态都是良好。
  4. 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,找到本告警,根据定位信息找到故障主机。
  1. 使用omm用户登录故障主机。
  2. 执行如下命令初始化环境变量:

    source 集群安装目录/FusionInsight_ClickHouse_*/*_*_ClickHouseServer/etc/ENV_VARS

    source 集群安装目录/FusionInsight_ClickHouse_*/*_*_ClickHouseServer/etc/clickhouse-env.sh

    export CLICKHOUSE_CONF_DIR=${CLICKHOUSE_CONF_DIR}

  3. 执行以下命令,运行元数据同步工具,从已有节点上同步元数据到故障节点:

    sh 集群安装目录/FusionInsight_ClickHouse_*/install/FusionInsight-ClickHouse-*/clickhouse/sbin/clickhouse-create-meta.sh true

  4. 执行以下命令,查看日志信息,确认元数据是否已经被同步。

    vim /var/log/Bigdata/clickhouse/clickhouseServer/start.log
    • 若同步完成,执行9
    • 若同步失败,执行10

  5. 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,在“告警ID”列找到对应告警项,单击“操作”列中的“清除”,在弹出界面单击“确定”,即可手动清除告警。

收集故障信息。

  1. 在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的“ClickHouse”,单击“确定”。
  3. 在“主机”中选择对应的主机。
  4. 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。
  5. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,需手工清除。

参考信息

无。

相关文档