更新时间:2024-10-11 GMT+08:00

MRS集群添加新磁盘

用户问题

MRS HBase服务不可用。

问题现象

用户主机的磁盘占用率过高导致服务故障。

原因分析

Core节点的磁盘容量不足导致无法提供正常服务。

处理步骤

  1. 购买云硬盘。
  2. 挂载云硬盘。

    • 若挂载云硬盘完成,请执行6
    • 若在云硬盘控制台执行 "挂载" 操作时无法选定云服务器,请执行3

  3. 登录弹性云服务器控制台,单击待扩容(挂载新磁盘)的弹性云服务器名称。
  4. “云硬盘”页签,单击“挂载磁盘”
  5. 选择待挂载的新磁盘并单击“确定”完成磁盘挂载。
  6. 初始化Linux数据盘。

    • 挂载点目录根据节点DataNode已有的实例编号递增,例如:使用df –h命令查到当前已有的编号为/srv/BigData/hadoop/data1,则新增挂载点为/srv/BigData/hadoop/data2。初始化Linux数据盘新建挂载点时,将新建挂载点命名为/srv/BigData/hadoop/data2,并将新建分区挂载到该挂载点下。例如
      mkdir /srv/BigData/hadoop/data2
      mount /dev/xvdb1 /srv/BigData/hadoop/data2
    /srv/BigData/hadoop/data2路径说明:本章节后续提到/srv/BigData/hadoop/data2路径均请按照以下场景自行修改。
    • 3.X版本目录为:/srv/BigData/data2
    • 3.X之前版本目录为:/srv/BigData/hadoop/data2

  7. 执行以下命令为新磁盘增加omm用户权限。

    chown omm:wheel 新增挂载点

    例如:chown omm:wheel /srv/BigData/hadoop/data2

  8. 执行chmod 701命令为新增的挂载点目录添加执行权限。

    chmod 701 新增挂载点

    例如:chmod 701 /srv/BigData/hadoop/data2

    chmod 701命令中701仅为示例,请以已有数据盘data1的数值为准。

  9. 登录Manager,扩容DataNode实例和NodeManager实例的数据磁盘。
  10. 修改当前节点DataNode实例配置。

    MRS Manager界面操作入口:登录MRS Manager,依次选择 “服务管理 > HDFS > 实例 > 扩容的DataNode节点 > 实例配置”,“参数类别”选择 "全部配置"。

    FusionInsight Manager界面操作入口:登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > HDFS > 实例 > 扩容的DataNode节点 > 实例配置”,选择 "全部配置"。

    • 方式一:手动修改当前节点DataNode实例配置。
      • 在 "搜索" 中输入"dfs.datanode.fsdataset.volume.choosing.policy",将参数值改为 "org.apache.hadoop.hdfs.server.datanode.fsdataset.AvailableSpaceVolumeChoosingPolicy"。
      • 在 "搜索" 中输入 "dfs.datanode.data.dir",将参数值改为"/srv/BigData/hadoop/data1/dn,/srv/BigData/hadoop/data2/dn"

      若此两个参数有修改,则单击 "保存配置",并勾选 "重启角色实例" ,重启DataNode实例。

    • 方式二:自动同步当前节点DataNode实例配置。
      1. 单击“同步配置”为HDFS服务启用新的配置参数。
      2. 完成同步配置后,请重启实例以使配置生效。
    • 如果确认当前未使用HDFS,并且希望较快完成重启,可以选择直接"重启角色实例" 。
    • 如果有任务在使用HDFS,为了防止数据异常或者任务失败,必须选择滚动重启。

  11. 修改当前节点Yarn NodeManager的实例配置。

    MRS Manager界面操作入口:登录MRS Manager,依次选择 "服务管理 > Yarn > 实例 > 扩容节点的NodeManager > 实例配置","参数类别" 选择 "全部配置"。

    FusionInsight Manager界面操作入口:登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > Yarn > 实例”单击扩容节点的NodeManager,选择“实例配置 > 全部配置”。

    • 方式一:手动修改当前节点Yarn NodeManager的实例配置。
      • 在“搜索”中输入 "yarn.nodemanager.local-dirs",将参数值修改为: "/srv/BigData/hadoop/data1/nm/localdir,/srv/BigData/hadoop/data2/nm/localdir" 。
      • 在“搜索”中输入 "yarn.nodemanager.log-dirs",将参数值修改为:"/srv/BigData/hadoop/data1/nm/containerlogs,/srv/BigData/hadoop/data2/nm/containerlogs"。

        若此两个参数有修改,则保存配置,并勾选 "重启角色实例" ,重启NodeManager实例。

    • 方式二:自动同步当前节点Yarn NodeManager的实例配置。
      1. 单击“同步配置”为Yarn服务启用新的配置参数。
      2. 完成同步配置后,请重启实例以使配置生效。

    • 如果确认当前未使用Yarn,并且希望较快完成重启,可以选择直接"重启角色实例" 。
    • 如果有任务在使用Yarn,为了防止数据异常或者任务失败,必须选择滚动重启。

  12. 查看扩容是否成功。

    MRS Manager界面操作:登录MRS Manager,依次选择 "服务管理 > HDFS > 实例 > 扩容的DataNode节点 "。

    FusionInsight Manager界面操作:登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > HDFS > 实例”,单击扩容的DataNode节点。

    在图表区域,查看实时监控项 "DataNode存储" 中 配置的总磁盘容量是否提升,若图表区域没有监控项 "DataNode存储" ,请单击“定制”增加该监控项。
    • 若配置的总磁盘容量已提升,则扩容完成。
    • 若配置的总磁盘容量未提升,请联系技术支持处理。

  13. (可选)扩容Kafka实例的数据盘。

    修改当前节点Kafka实例配置。

    1. 进入Kafka扩容的Broker节点参数配置界面。

      MRS Manager界面操作:登录MRS Manager,依次选择 "服务管理 > Kafka > 实例 > 扩容的Broker节点 > 实例配置","参数类别" 选择 "全部配置"。

      FusionInsight Manager界面操作:登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > Kafka > 实例> 扩容的Broker节点 > 实例配置”, 选择 “全部配置”。

    2. 在 "搜索" 中输入"log.dirs",加入新增磁盘信息,中间用英文 “,” 分割。

      例如原始只有一块Kafka数据盘,新增一块,则将"/srv/BigData/kafka/data1/kafka-logs" 改为 "/srv/BigData/kafka/data1/kafka-logs,/srv/BigData/kafka/data2/kafka-logs"。

    3. 保存配置,并勾选 "重启角色实例" 后根据提示重启实例。
    4. 查看扩容是否成功。

      MRS Manager界面操作入口:登录MRS Manager,依次选择 "服务管理 > Kafka > 实例 > 扩容的Broker节点 "。

      FusionInsight Manager界面操作入口:登录FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > Kafka > 实例> 扩容的Broker节点 ”。

      查看实时监控项 "Broker磁盘容量大小" 中配置的总磁盘容量是否提升。

集群的节点扩容磁盘之后,若再扩容集群节点时需要在新扩容的节点上参考该页面处理步骤执行添加磁盘的操作,否则会有数据丢失的风险 。

建议与总结

  • 当磁盘的使用率超过85%时,建议用户进行磁盘扩容,并将新购买的磁盘挂载到弹性云服务器上与集群进行关联。
  • 具体挂载步骤、配置参数请根据实际情况进行。