更新时间:2024-05-28 GMT+08:00

FE启动失败

现象描述

FE实例启动失败,“/var/log/Bigdata/doris/fe/fe.log”日志中一直滚动报错:

wait catalog to be ready. FE type UNKNOWN

原因分析

  • FE安装节点有多个网卡IP,没有正确设置“priority_network”参数导致FE启动时匹配了错误的IP地址。
  • 集群内多数Follower FE节点未启动,例如有3个Follower FE,只启动了一个。

处理步骤

  1. 登录FusionInsight Manager,选择“集群 > 服务 > Doris > 配置”。
  2. 搜索“priority_network”参数,并正确设置FE的该参数值,FE节点已绑定的网卡IP可通过“FE安装目录/FusionInsight_Doris_*/1_*_FE/etc/ENV_VARS”中的“CURRENT_INSTANCE_IP”变量查看。

    “priority_network”主要用于帮助系统选择正确的网卡IP作为FE或BE的IP,建议任何情况下,都显式的设置该参数,避免后续机器增加新网卡导致IP选择不正确问题。“priority_network”的值是CIDR格式表示的,用于保证所有节点都可以使用统一的配置值。参数值分为两部分,第一部分是点分十进制的IP地址,第二部分是一个前缀长度。

    例如,10.168.1.0/8会匹配所有10.xx.xx.xx的IP地址;10.168.1.0/16会匹配所有10.168.xx.xx的IP地址;如果有两个节点:10.168.10.1和10.168.10.2,则可以使用10.168.10.0/24来作为 “priority_network”的值。

  3. 单击“实例”,勾选需启动的Follower FE,单击“启动实例”。例如有3 个Follower,只启动了一个,此时需要将另外至少一个FE也启动,FE可选举组才能选举出Master提供服务。
  4. 如果FE依然启动失败,请运维进行恢复。