配置HDFS连接
MRS HDFS
连接MRS上的HDFS数据源时,相关参数如表1所示。
 
   - 新建MRS连接前,需在MRS中添加一个kerberos认证用户并登录MRS管理页面更新其初始密码,然后使用该新建用户创建MRS连接。
 - 如需连接MRS 2.x版本的集群,请先创建2.x版本的CDM集群。CDM 1.8.x版本的集群无法连接MRS 2.x版本的集群。
 - 
      需确保MRS集群和DataArts Studio实例之间网络互通,网络互通需满足如下条件:
- DataArts Studio实例(指DataArts Studio实例中的CDM集群)与MRS集群处于不同区域的情况下,需要通过公网或者专线打通网络。通过公网互通时,需确保CDM集群已绑定EIP,MRS集群可以访问公网且防火墙规则已开放连接端口。
 - DataArts Studio实例(指DataArts Studio实例中的CDM集群)与MRS集群同区域情况下,同虚拟私有云、同子网、同安全组的不同实例默认网络互通;如果同虚拟私有云但子网或安全组不同,还需配置路由规则及安全组规则,配置路由规则请参见《虚拟私有云(VPC)使用指南》中的“自定义路由(Region Type Ⅰ)> 添加路由信息”章节,配置安全组规则请参见《虚拟私有云(VPC)使用指南》中的“安全组 > 添加安全组规则”章节。
 - 此外,还需确保该MRS集群与DataArts Studio工作空间所属的企业项目相同,如果不同,您需要修改工作空间的企业项目。
 
 
| 
        参数名  | 
      
        说明  | 
      
        取值样例  | 
     
|---|---|---|
| 
        名称  | 
      
        连接的名称,根据连接的数据源类型,用户可自定义便于记忆、区分的连接名。  | 
      
        mrs_hdfs_link  | 
     
| 
        Manager IP  | 
      
        MRS Manager的浮动IP地址,可以单击输入框后的“选择”来选定已创建的MRS集群,CDM会自动填充下面的鉴权参数。  | 
      
        127.0.0.1  | 
     
| 
        用户名  | 
      
        选择KERBEROS鉴权时,需要配置MRS Manager的用户名和密码。从HDFS导出目录时,如果需要创建快照,这里配置的用户需要HDFS系统的管理员权限。 
        如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以创建一个新的MRS用户,然后在创建MRS数据连接时,“用户名”和“密码”填写为新建的MRS用户及其密码。
         
          说明: 
          
       
  | 
      
        cdm  | 
     
| 
        密码  | 
      
        访问MRS Manager的用户密码。  | 
      
        -  | 
     
| 
        认证类型  | 
      
        
        访问MRS的认证类型:
         
  | 
      
        SIMPLE  | 
     
| 
        运行模式  | 
      
        
        选择HDFS连接的运行模式:
        
        
       若不使用AGENT运行模式,且在一个CDM中同时连接两个及以上开启Kerberos认证且realm相同的集群,只能使用EMBEDDED运行模式连接其中一个集群,其余需使用STANDALONE。  | 
      
        STANDALONE  | 
     
| 
        Agent  | 
      
        单击“选择”,选择连接Agent中已创建的Agent。运行模式选择Agent时显示此参数。  | 
      
        -  | 
     
| 
        是否使用集群配置  | 
      
        您可以通过使用集群配置,简化Hadoop连接参数配置。  | 
      
        否  | 
     
| 
        集群配置名  | 
      
        仅当“是否使用集群配置”为“是”时,此参数有效。此参数用于选择用户已经创建好的集群配置。 集群配置的创建方法请参见管理集群配置。  | 
      
        hdfs_01  | 
     
单击“显示高级属性”,然后单击“添加”,您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性,可单击属性后的“删除”按钮进行删除。
FusionInsight HDFS
连接FusionInsight HD上的HDFS数据源时,相关参数如表2所示。
| 
        参数名  | 
      
        说明  | 
      
        取值样例  | 
     
|---|---|---|
| 
        名称  | 
      
        连接的名称,根据连接的数据源类型,用户可自定义便于记忆、区分的连接名。  | 
      
        FI_hdfs_link  | 
     
| 
        Manager IP  | 
      
        FusionInsight Manager平台的地址。  | 
      
        127.0.0.1  | 
     
| 
        Manager端口  | 
      
        FusionInsight Manager平台的端口。  | 
      
        28443  | 
     
| 
        CAS Server端口  | 
      
        与FusionInsight对接的CAS Server的端口。  | 
      
        20009  | 
     
| 
        用户名  | 
      
        登录FusionInsight Manager平台的用户名。 从HDFS导出目录时,如果需要创建快照,这里配置的用户需要HDFS系统的管理员权限。  | 
      
        cdm  | 
     
| 
        密码  | 
      
        FusionInsight Manager平台的密码。  | 
      
        -  | 
     
| 
        认证类型  | 
      
        
        访问集群的认证类型:
         
  | 
      
        KERBEROS  | 
     
| 
        运行模式  | 
      
        
        选择HDFS连接的运行模式:
        
         | 
      
        STANDALONE  | 
     
| 
        Agent  | 
      
        单击“选择”,选择连接Agent中已创建的Agent。运行模式选择Agent时显示此参数。  | 
      
        -  | 
     
| 
        是否使用集群配置  | 
      
        您可以通过使用集群配置,简化Hadoop连接参数配置。  | 
      
        否  | 
     
| 
        集群配置名  | 
      
        仅当“是否使用集群配置”为“是”时,此参数有效。此参数用于选择用户已经创建好的集群配置。 集群配置的创建方法请参见管理集群配置。  | 
      
        hdfs_01  | 
     
单击“显示高级属性”,然后单击“添加”,您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性,可单击属性后的“删除”按钮进行删除。
Apache HDFS
连接Apache Hadoop上的HDFS数据源时,相关参数如表3所示。
| 
        参数名  | 
      
        说明  | 
      
        取值样例  | 
     
|---|---|---|
| 
        名称  | 
      
        连接的名称,根据连接的数据源类型,用户可自定义便于记忆、区分的连接名。  | 
      
        hadoop_hdfs_link  | 
     
| 
        URI  | 
      
        表示NameNode URI地址。可以填写为:hdfs://namenode实例的ip:8020。  | 
      
        hdfs://IP:8020  | 
     
| 
        认证类型  | 
      
        
        访问集群的认证类型:
         
  | 
      
        KERBEROS  | 
     
| 
        Principal  | 
      
        认证类型为“KERBEROS”时,需要填写Principal。Principal即Kerberos安全模式下的用户名,可以联系Hadoop管理员获取。此处填写的Principal需要与Keytab文件保持一致。  | 
      
        -  | 
     
| 
        Keytab文件  | 
      
        认证类型为“KERBEROS”时,需要上传Keytab文件。Keytab文件为认证凭据文件,可以联系Hadoop管理员获取。获取Keytab文件前,需要在集群上至少修改过一次此用户的密码,否则下载获取的keytab文件可能无法使用。另外,修改用户密码后,之前导出的keytab将失效,需要重新导出。  | 
      
        -  | 
     
| 
        运行模式  | 
      
        
        选择HDFS连接的运行模式:
        
         | 
      
        STANDALONE  | 
     
| 
        IP与主机名映射  | 
      
        运行模式选择“EMBEDDED”、“STANDALONE”时,该参数有效。 如果HDFS配置文件使用主机名,需要配置IP与主机的映射。格式:IP与主机名之间使用空格分隔,多对映射使用分号或回车换行分隔。  | 
      
        10.1.6.9 hostname01 10.2.7.9 hostname02  | 
     
| 
        Agent  | 
      
        运行模式选择“Agent”时,单击“选择”,选择连接Agent中已创建的Agent。  | 
      
        -  | 
     
| 
        是否使用集群配置  | 
      
        您可以通过使用集群配置,简化Hadoop连接参数配置。  | 
      
        否  | 
     
| 
        集群配置名  | 
      
        仅当“是否使用集群配置”为“是”时,此参数有效。此参数用于选择用户已经创建好的集群配置。 集群配置的创建方法请参见管理集群配置。  | 
      
        hdfs_01  |