更新时间:2024-08-08 GMT+08:00
分享

MRS Hudi数据连接参数说明

表1 MRS Hudi连接

参数

是否必选

说明

数据连接类型

MRS Hudi连接固定选择为MapReduce服务(MRS Hudi)。

数据连接名称

数据连接的名称,只能包含字母、数字、下划线和中划线,且长度不超过100个字符。

标签

标识数据连接的属性。设置标签后,便于统一管理。
说明:

标签的名称,只能包含中文、英文字母、数字和下划线,不能以下划线开头,且长度不能超过100个字符。

适用组件

选择此连接适用的组件。勾选组件后,才能在相应组件内使用本连接。

说明:
  • 当开启数据集成作业白名单后,可勾选数据集成组件,勾选后在数据开发组件创建集成作业时支持选择本数据连接。
  • 数据集成作业功能当前需申请白名单后才能使用。如需使用该特性,请提交工单。

基础与网络连通配置

手动

通过代理连接的时候,此项可配置,通过勾选按钮来选择集群名模式或连接串模式。

  • 使用集群名模式时通过选择填写集群名称进行连接配置。
  • 使用连接串模式填写对应集群的IP和端口进行连接配置。
如无访问其他项目或企业项目MRS集群的需求,则无需开启手动模式。
  • 开启手动模式时,通过手动输入Manager IP,并打通本连接Agent(即CDM集群)和MRS集群之间的网络,则可以访问其他资源空间(包括其他VDC内的资源空间)项目或企业项目的MRS集群。
  • 关闭手动模式时,仅可选择本资源空间项目内且企业项目相同的MRS集群进行连接。

MRS集群名

选择所属的MRS集群。仅支持连接MRS云服务,自建Hadoop集群必须在纳管到MRS云服务后才可以选择。系统会显示所有项目ID和企业项目相同的MRS集群。

如果选择集群后连接失败,请检查MRS集群与作为Agent的CDM实例是否网络互通。网络互通需满足如下条件:
  • DataArts Studio实例(指DataArts Studio实例中的CDM集群)与MRS集群处于不同区域的情况下,需要通过公网或者专线打通网络。通过公网互通时,需确保CDM集群已绑定EIP,MRS集群可以访问公网且防火墙规则已开放连接端口。
  • DataArts Studio实例(指DataArts Studio实例中的CDM集群)与MRS集群同区域情况下,同虚拟私有云、同子网、同安全组的不同实例默认网络互通;如果同虚拟私有云但子网或安全组不同,还需配置路由规则及安全组规则,配置路由规则请参见如何配置路由规则章节,配置安全组规则请参见如何配置安全组规则章节。
  • 此外,还需确保该MRS集群与DataArts Studio工作空间所属的企业项目相同,如果不同,您需要修改工作空间的企业项目。
说明:

当同一Agent连接多个MRS集群时,如果其中一个MRS集群被删除或状态异常,会影响另外一个正常的MRS集群数据连接。因此建议一个Agent对应一个MRS集群数据连接。

Manager IP

勾选连接串模式时显示该参数。

此参数填写为MRS Manager的浮动IP地址。仅支持连接MRS云服务,自建Hadoop集群必须先纳管到MRS云服务才能连接。

注意,通过输入框后的“选择”按钮仅能获取本项目内且企业项目相同的MRS集群,如果需要访问其他项目或企业项目的MRS集群,则需要获取MRS Manager的浮动IP地址并手动输入,并确保已打通本连接Agent(即CDM集群)和MRS租户面集群之间的网络。Manager的浮动IP地址可通过登录MRS集群主Master节点获取,执行ifconfig命令,回显中eth0:wsom的IP就是MRS Manager的浮动IP。登录MRS集群Master节点请参见登录集群节点章节,如果登录的是非主Master节点无法查询,请切换到另一个Master节点查询。

手动填写IP时请根据场景和顺序填写,多个IP之间使用","分隔。例如: 127.0.0.1或127.0.0.1,127.0.0.2,127.0.0.3。
  • 填写单个IP,IP应为MRS集群管理面的浮动IP。
  • 填写3个IP时,应填写MRS集群业务面的主节点IP、备节点IP和MRS集群管理面的浮动IP。

KMS密钥

“数据集成”参数开启时,呈现此参数。

通过KMS加密和解密用户密码和密钥对的密码,选择KMS中已创建的密钥。

绑定Agent

“数据集成”参数开启时,呈现此参数。

通过代理连接时,需要选择CDM集群,CDM集群提供Agent。

数据集成配置

属性配置

其他客户端配置属性。

例如:

1. socketTimeout:配置Hive JDBC连接超时时间,单位为秒;

2. fs.defaultFS:配置HDFS元数据的NameNode URI地址;

3. hadoop.user.name:配置访问HDFS时的用户名。

数据源认证及其他功能配置

认证类型

开启手动模式时,是必选项。

访问MRS的认证类型:
  • SIMPLE:非安全模式选择Simple鉴权。
  • KERBEROS:安全模式选择Kerberos鉴权。

用户名

MRS集群的用户名,通过代理连接的时候,是必选项。如果使用新建的MRS用户进行连接,您需要先登录Manager页面,并更新初始密码。

如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以参考创建MRS安全集群的kerberos认证用户创建一个新的MRS用户,然后在创建MRS数据连接时,“用户名”“密码”填写为新建的MRS用户及其密码。
说明:
  • MRS 3.1.0及之后版本集群,所创建的用户至少需具备Manager_viewer的角色权限才能在管理中心创建连接;如果需要对应组件的进行库、表、数据的操作,还需要添加对应组件的用户组权限。
  • MRS 3.1.0版本之前的集群,所创建的用户需要具备Manager_administrator或System_administrator权限,才能在管理中心创建连接。
  • 仅具备Manager_tenant或Manager_auditor权限,无法创建连接。

密码

MRS集群的访问密码,通过代理连接的时候,是必选项。

OBS支持

是否支持OBS存储,如果hudi表数据存储在OBS,需要打开此开关。

使用委托

OBS为是时显示该参数。

开启委托功能,即可以在无需持有永久AKSK的情况下创建数据连接,根据DLF配置的调度身份执行CDM作业。

公共委托

使用委托为是时显示该参数。

仅涉及用于测试该连接委托功能是否正常,作业运行将根据DLF配置的调度身份执行CDM作业。

访问标识(AK)

“数据集成”参数开启时并且“OBS支持”设置为“是”、使用委托为否时,呈现此参数。

AK和SK分别为登录OBS服务器的访问标识与密钥。

您需要先创建当前账号的访问密钥,并获得对应的AK和SK。

您可以通过如下方式获取访问密钥。
  1. 登录控制台,在用户名下拉列表中选择“我的凭证”。
  2. 进入“我的证”页面,选择访问密钥 > 新增访问密钥,如图1所示。
    图1 单击新增访问密钥
  3. 单击“确定”,根据浏览器提示,保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件,即可查看访问密钥(Access Key Id和Secret Access Key)。
    说明:
    • 每个用户仅允许新增两个访问密钥。
    • 为保证访问密钥的安全,访问密钥仅在初次生成时自动下载,后续不可再次通过管理控制台界面获取。请在生成后妥善保管。

密钥(SK)

OBS测试路径

“OBS支持”设置为“是”时,呈现此参数。

请填写完整的文件路径,将调用元数据查询接口来校验路径的访问权限。

说明:
  • 如果是对象存储,路径需要填写到对象级别,否则会报错404,例如:“obs://bucket/dir/test.txt”
  • 如果是并行文件系统,则可以只填写到目录级别。例如:“obs://bucket/dir”

创建MRS安全集群的kerberos认证用户

如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以参考以下步骤创建一个新的MRS用户:

针对MRS 3.x版本集群:

  1. 使用admin账户登录MRS服务的Manager页面。
  2. 在Manager页面选择“系统 > 权限 > 安全策略 > 密码策略”,单击“新增密码策略”,添加一个永不过期的密码策略。
    • “密码策略名”可配置为“neverexp”。
    • “密码有效期(天)”配置为“0”,表示永不过期。
    • “密码失效提前提醒天数”配置为“0”。
    • 其他参数保持默认即可。
  3. 在Manager页面选择“系统 > 权限 > 用户”,单击“添加用户”,添加一个专有用户作为kerberos认证用户,密码策略选择为永不过期策略“neverexp”,并且为这个用户添加用户组和分配角色权限,用户组选择superGroup,角色建议全选,然后根据页面提示完成用户的创建。
    • MRS 3.1.0及之后版本集群,所创建的用户至少需具备Manager_viewer的角色权限才能在管理中心创建连接;如果需要对应组件的进行库、表、数据的操作,还需要添加对应组件的用户组权限。
    • MRS 3.1.0版本之前的集群,所创建的用户需要具备Manager_administrator或System_administrator权限,才能在管理中心创建连接。
    • 仅具备Manager_tenant或Manager_auditor权限,无法创建连接。
  4. 使用新建的用户登录Manager页面,并更新初始密码,否则会导致创建连接失败。
  5. 同步IAM用户。
    1. 登录MRS管理控制台。
    2. 选择“集群列表 > 现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
    3. 在“概览”页签的基本信息区域,单击“IAM用户同步”右侧的“同步”进行IAM用户同步。
      • 当IAM用户的用户组的所属策略从MRS ReadOnlyAccess向MRS CommonOperations、MRS FullAccess、MRS Administrator变化时,由于集群节点的SSSD(System Security Services Daemon)缓存刷新需要时间,因此同步完成后,请等待5分钟,等待新修改策略生效之后,再进行提交作业。否则,会出现提交作业失败的情况。
      • 当IAM用户的用户组的所属策略从MRS CommonOperations、MRS FullAccess、MRS Administrator向MRS ReadOnlyAccess变化时,由于集群节点的SSSD缓存刷新需要时间,因此同步完成后,请等待5分钟,新修改策略才能生效。

针对MRS 2.x及之前版本集群 :

  1. 使用admin账户登录MRS Manager页面。
  2. 在Manager页面的“系统设置”中,单击“密码策略配置”,修改密码策略。
    • “密码有效期(天)”配置为“0”,表示永不过期。
    • “密码失效提前提醒天数”配置为“0”。
    • 其他参数保持默认即可。
  3. 在MRS Manager页面的“系统设置”中,单击“用户管理”,在用户管理页面,添加用户,添加一个专有用户作为kerberos认证用户,并且为这个用户添加用户组和分配角色权限,用户组选择superGroup,角色建议全选,然后根据页面提示完成用户的创建。
    • MRS 2.x及之前版本集群,所创建的用户需要具备Manager_administrator或System_administrator权限,才能在管理中心创建连接。
    • 仅具备Manager_tenant或Manager_auditor权限,无法创建连接。
  4. 使用新建的用户登录MRS Manager页面,并更新初始密码,否则会导致创建连接失败。
  5. 同步IAM用户。
    1. 登录MRS管理控制台。
    2. 选择“集群列表 > 现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
    3. 在“概览”页签的基本信息区域,单击“IAM用户同步”右侧的“同步”进行IAM用户同步。
      • 当IAM用户的用户组的所属策略从MRS ReadOnlyAccess向MRS CommonOperations、MRS FullAccess、MRS Administrator变化时,由于集群节点的SSSD(System Security Services Daemon)缓存刷新需要时间,因此同步完成后,请等待5分钟,等待新修改策略生效之后,再进行提交作业。否则,会出现提交作业失败的情况。
      • 当IAM用户的用户组的所属策略从MRS CommonOperations、MRS FullAccess、MRS Administrator向MRS ReadOnlyAccess变化时,由于集群节点的SSSD缓存刷新需要时间,因此同步完成后,请等待5分钟,新修改策略才能生效。

相关文档