文档首页/ MapReduce服务 MRS/ 用户指南/ MRS集群运维/ MRS集群告警处理参考/ ALM-45475 Kudu组件数据表中存在单副本
更新时间:2025-08-09 GMT+08:00

ALM-45475 Kudu组件数据表中存在单副本

告警解释

系统检测Kudu数据表的副本状态,当检测到Kudu数据表中存在单副本时,产生该告警。

当Kudu数据表中所有表的副本都为多副本或无数据时,告警清除。

告警属性

告警ID

告警级别

是否自动清除

45475

重要

告警参数

类别

参数名称

参数含义

定位信息

来源

产生告警的集群名称。

服务名

产生告警的服务名称。

角色名

产生告警的角色名称。

主机名

产生告警的主机名。

对系统的影响

当硬件出现故障时,例如慢盘或者坏盘时后更换磁盘,Kudu数据可能会丢失。

处理步骤

  1. 使用root用户登录MRS集群客户端节点,切换到omm用户。

    su - omm

  2. 执行如下命令,初始化客户端。

    source /opt/Bigdata/client/bigdata_env

  3. 如果当前集群已启用Kerberos认证(安全模式),执行以下命令认证当前用户。如果当前集群未启用Kerberos认证(普通模式),则无需执行本步骤。

    kinit {用户名}

  4. 执行以下命令查询各个数据表的详细信息,查看是否存在RF为1的表。

    kudu cluster ksck <master_addresses>

    master_addresses:格式为“KuduMaster业务IP地址1:7051,KuduMaster业务IP地址2:7051,KuduMaster业务IP地址3:7051”。

    KuduMaster业务IP地址:可以登录FusionInsight Manager,选择“集群 > 服务 > Kudu > 实例”查看KuduMaster实例业务IP地址获取。

    • 是,请评估是否保持单副本,建议重建该表并选择至少3副本。
    • 否,执行步骤 5

收集故障信息

  1. 在FusionInsight Manager首页,单击“运维 > 日志 > 下载”。
  2. 在“服务”中勾选待操作集群的“Kudu”。
  3. 单击右上角的时间编辑按钮,设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系运维人员,并发送已收集的故障日志信息。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息