更新时间:2022-02-24 GMT+08:00

端口被占用导致RegionServer启动失败

问题现象

Manager页面监控发现RegionServer状态为Restoring。

原因分析

  1. 通过查看RegionServer日志(/var/log/Bigdata/hbase/rs/hbase-omm-xxx.log)。
  2. 使用lsof -i:21302(MRS1.7.X及以后端口号是16020)查看到pid,然后根据pid查看到相应的进程,发现RegionServer的端口被DFSZkFailoverController占用。
  3. 查看“/proc/sys/net/ipv4/ip_local_port_range”显示为“9000 65500”,临时端口范围与MRS产品端口范围重叠,因为安装时未进行preinstall操作。

解决办法

  1. 执行kill -9 DFSZkFailoverController的pid, 使得其重启后绑定其它端口,然后重启Restoring的RegionServer。