更新时间:2026-06-11 GMT+08:00
分享

对接互信集群的HDFS

操作场景

在跨集群数据迁移时,需要实现源集群与目标集群HDFS的双向访问能力,例如使用Distcp工具进行数据迁移时,需确保源集群和目标集群的网络互通。

传统方案需通过手动修改客户端hdfs-site.xml配置文件来实现,这种操作模式存在配置易出错、维护成本高、版本兼容性难以保障等问题。通过本章节提供的方案,可以快速配置源集群和目标集群的互相访问,从而在保障数据互通安全性的前提下,提升跨集群数据迁移效率,同时降低因配置错误导致的业务中断风险。

限制与约束

该章节仅适用于MRS 3.6.0-LTS.1及之后版本。

前提条件

  • 当前集群与目标集群需要网络互通。
  • 当前集群与目标集群的认证模式,及与互信的关系如下:

    当前集群模式

    被访问集群模式

    是否需要进行互信

    集群已启用Kerberos认证(安全模式)

    集群已启用Kerberos认证(安全模式)

    两集群需进行互信

    集群已启用Kerberos认证(安全模式)

    集群未启用Kerberos认证(普通模式)

    无需进行互信操作

    集群未启用Kerberos认证(普通模式)

    集群未启用Kerberos认证(普通模式)

    无需进行互信操作

    集群未启用Kerberos认证(普通模式)

    集群已启用Kerberos认证(安全模式)

    无法访问

操作步骤

  1. 登录待配置互信集群的Manager页面,选择“集群 > 服务 > HDFS > 配置 > 全部配置”。
  2. 在左侧导航栏选择“跨集群对接”,修改以下参数,修改完成后单击“保存”按钮保存配置。

    表1 跨集群对接参数

    参数名称

    描述

    取值样例

    dfs.expend.ns

    被访问集群的NameService在本集群的名称。

    • 可以在Manager中选择“集群 > 服务 > HDFS > 管理NameService”,查看NameService名称获取。
    • 参数取值可以与被访问集群不一致,但是不能和本集群已经存在的NameService名称一致。

    hacluster

    dfs.namenode.rpc-address

    被访问NameService的IP和端口信息。格式为“IP地址:端口”。

    • IP地址:登录Manager,选择“集群 > 服务 > HDFS > 实例”,查看并记录主NameNode实例的业务IP地址。
    • 端口号:登录Manager,选择“集群 > 服务 > HDFS > 配置 > 全部配置”,搜索并记录“dfs.namenode.rpc.port”参数值。

      “dfs.namenode.rpc.port”表示NameNode处理所有客户端请求的RPC端口号,默认值为“25000”。

    10.x.x.x:25000

  3. 如果当前为数据迁移场景则无需重启,直接执行4。如果当前不为数据迁移场景,则需按照以下步骤重启HDFS及上层组件。

    选择“集群 > 服务 > HDFS > 概览”,选择“更多 > 重启服务”,重启HDFS以及上层组件。

  4. 更新客户端配置。

    更新客户端的具体操作,请参考服务端配置过期后更新MRS集群客户端

相关文档