MRS Hive数据连接参数说明
|
参数 |
是否必选 |
说明 |
|---|---|---|
|
数据连接类型 |
是 |
MRS Hive连接固定选择为MapReduce服务(MRS Hive)。 |
|
数据连接名称 |
是 |
数据连接的名称,只能包含字母、数字、下划线和中划线,且长度不超过100个字符。 |
|
描述 |
否 |
为更好地识别数据连接,此处加以描述信息,长度不能超过100个字符。 |
|
标签 |
否 |
标识数据连接的属性。设置标签后,便于统一管理。
说明:
标签的名称,只能包含中文、英文字母、数字和下划线,不能以下划线开头,且长度不能超过100个字符。 |
|
适用组件 |
是 |
选择此连接适用的组件。勾选组件后,才能在相应组件内使用本连接。
说明:
|
|
基础与网络连通配置 |
||
|
连接方式 |
是 |
选择所需的连接方式,推荐使用“通过代理连接”。
说明:
如果此连接需要用于数据集成和数据开发之外的组件,则此处连接方式不能配置为“MRS API连接”。 选择“MRS租户面连接”时,且是MRS纳管集群,需要参考《MapReduce服务(MRS) x.x.x 使用指南 》>《用户指南》中的“JobGateway组件配置OBS与IAM”章节配置完成后,数据连接才可创连成功。 |
|
手动 |
是 |
通过代理连接时,是必选项。
选择连接模式。如无访问其他项目或企业项目下MRS集群的需求,使用集群名模式即可。
|
|
Manager IP |
是 |
使用连接串模式时,是必选项。
此参数填写为MRS Manager的浮动IP地址。仅支持连接MRS云服务,自建Hadoop集群必须先纳管到MRS云服务才能连接。
说明:
注意,通过输入框后的“选择”按钮仅能获取本项目内且企业项目相同的MRS集群,如果需要访问其他项目或企业项目的MRS集群,则需要获取MRS Manager的浮动IP地址并手动输入,并确保已打通本连接Agent(即CDM集群)和MRS租户面集群之间的网络。Manager的浮动IP地址可通过登录MRS集群主Master节点获取,执行ifconfig命令,回显中eth0:wsom的IP就是MRS Manager的浮动IP。登录MRS集群Master节点请参见登录集群节点章节,如果登录的是非主Master节点无法查询,请切换到另一个Master节点查询。
手动填写IP时请根据场景和顺序填写,多个IP之间使用","分隔。例如: 127.0.0.1或127.0.0.1,127.0.0.2,127.0.0.3。
|
|
MRS集群名 |
是 |
通过MRS API连接或使用集群名模式时,是必选项。
选择所属的MRS集群。仅支持连接MRS云服务,自建Hadoop集群必须在纳管到MRS云服务后才可以选择。系统会显示所有项目ID和企业项目相同的MRS集群。
说明:
如果选择集群后连接失败,请检查MRS集群与作为Agent的CDM实例是否网络互通。网络互通需满足如下条件:
说明:
当同一Agent连接多个MRS集群时,如果其中一个MRS集群被删除或状态异常,会影响另外一个正常的MRS集群数据连接。因此建议一个Agent对应一个MRS集群数据连接。 |
|
KMS加密密钥 |
否 |
通过代理连接时,是必选项。
通过KMS加解密数据源认证信息,选择KMS中的任一默认密钥或自定义密钥即可。
说明:
|
|
jobGateway IP |
是 |
|
|
绑定Agent |
是 |
通过代理连接和MRS租户面连接时,是必选项。 MRS为非全托管服务,DataArts Studio无法直接与非全托管服务进行连接。CDM集群提供了DataArts Studio与非全托管服务通信的代理,所以创建MRS的数据连接时,请选择一个CDM集群。如果没有可用的CDM集群,请参考创建CDM集群进行创建。 CDM集群作为网络代理,必须和MRS集群网络互通才可以成功创建MRS连接,为确保两者网络互通,CDM集群必须和MRS集群处于相同的区域、可用区,且使用同一个VPC和子网,安全组规则需允许两者网络互通。 |
|
数据源认证及其他功能配置 |
||
|
认证类型 |
是 |
使用连接串模式时,是必选项。
访问MRS的认证类型:
|
|
用户名 |
是 |
MRS集群的人机用户,通过代理连接时是必选项。如果使用新建的MRS用户进行连接,您需要先登录Manager页面,并更新初始密码。
如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以参考创建MRS安全集群的kerberos认证用户创建一个新的密码永不过期MRS用户,然后在创建MRS数据连接时,“用户名”和“密码”填写为新建的MRS用户及其密码。
说明:
|
|
密码 |
是 |
MRS集群的访问密码,通过代理连接的时候,是必选项。 |
|
开启ldap |
否 |
当“连接方式”参数选择为“通过代理连接”时,显示该配置项。 当MRS Hive对接外部LDAP开启了LDAP认证时,连接Hive时需要使用LDAP账号与密码进行认证,此时必须开启此参数,否则会连接失败。 |
|
ldap用户名 |
是 |
当“开启ldap”参数选择为“是”时,此参数是必选项。 填写为MRS Hive开启LDAP认证时配置的用户名。 |
|
ldap密码 |
是 |
当“开启ldap”参数选择为“是”时,此参数是必选项。 填写为MRS Hive开启LDAP认证时配置的密码。 |
|
MRS认证类型 |
是 |
通过MRS租户面连接时,是必选项。
说明:
iam方式使用的token具有24小时过期机制,需要通过编辑数据连接(无需修改配置直接保存)定期更新token,仅建议用于测试和验证。对于生产调度任务,推荐使用keytab方式。 |
|
用户名 |
是 |
通过MRS租户面连接通过keytab认证时,是必选项。 使用Kerberos认证类型的MRS集群时,不支持使用admin用户来创建连接。此处用户名为MRS集群的人机用户或机机用户,通过MRS租户面连接时是必选项。 如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以参考创建MRS安全集群的kerberos认证用户创建一个新的密码永不过期MRS用户,然后在创建MRS数据连接时,“用户名”填写为新建的MRS用户。 |
|
keytab文件 |
是 |
通过MRS租户面连接通过keytab认证时,是必选项。 单击“选择”,弹出“驱动文件”页面,选择一个已经上传的.keytab格式的文件,单击“确定”。 如果还没有keytab文件,请先获取该文件并上传,在选择已上传的文件。获取keytab文件的操作如下: 登录MRS操作台,在“现有集群”下选择所需集群,并单击集群名称进入,单击“下载认证凭据”即可下载。下载后解压上传.keytab格式的文件即可。
说明:
用户至少具备以下权限之一,keytab文件才能正常上传:
|
|
元数据实时同步 |
是 |
打开元数据实时同步开关后,连接的MRS集群元数据会实时同步到数据地图组件,推荐开启。
说明:
|
|
元数据采集范围 |
否 |
配置元数据实时同步的数据库和数据表范围,不填写默认不筛选。 可填写为如下两种形式之一:
例如:
|
|
OBS支持 |
否 |
适用组件勾选数据集成后,呈现此参数。 需服务端支持OBS存储。在创建Hive表时,您可以指定将表存储在OBS中。 |
|
使用委托 |
否 |
适用组件勾选数据集成后,呈现此参数。 开启委托功能,即可以在无需持有永久AK\SK的情况下创建数据连接,根据DLF配置的调度身份执行CDM作业。 |
|
公共委托 |
否 |
适用组件勾选数据集成且“使用委托”选择“是”时,呈现此参数。 仅涉及用于测试该连接委托功能是否正常,作业运行将根据DLF配置的调度身份执行CDM作业。 |
|
访问标识(AK) |
- |
适用组件勾选数据集成且“OBS支持”选择“是”时,呈现此参数。 AK和SK分别为登录OBS服务器的访问标识与密钥。 您需要先创建当前账号的访问密钥,并获得对应的AK和SK。
您可以通过如下方式获取访问密钥。
|
|
密钥(SK) |
- |
|
|
数据集成配置 |
||
|
Hive版本 |
HIVE_3_X |
适用组件勾选数据集成后,呈现此参数。 Hive的版本。根据服务端Hive版本设置。
说明:
HIVE_3_X支持Hive服务端版本为3.x的连接,HIVE_2_X支持Hive服务端版本为2.x的连接。使用不匹配的连接版本,测试连接有可能正常,也可能会出现查询库表为空,或者作业失败等不正常场景。 |
|
运行模式 |
EMBEDDED |
“HIVE_3_X”版本支持该参数。支持以下模式:
|
|
检查Hive JDBC连通性 |
否 |
适用组件勾选数据集成后,呈现此参数。 是否需要测试Hive JDBC连通。 |
创建MRS安全集群的kerberos认证用户
如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以参考以下步骤创建一个新的MRS用户:
针对MRS 3.x版本集群:
- 使用admin账户登录MRS服务的Manager页面。
- 在Manager页面选择“系统 > 权限 > 安全策略 > 密码策略”,单击“新增密码策略”,添加一个永不过期的密码策略。
- “密码策略名”可配置为“neverexp”。
- “密码有效期(天)”配置为“0”,表示永不过期。
- “密码失效提前提醒天数”配置为“0”。
- 其他参数保持默认即可。
- 在Manager页面选择“系统 > 权限 > 用户”,单击“添加用户”,添加一个专有人机用户作为kerberos认证用户,密码策略选择为永不过期策略“neverexp”,并且为这个用户添加用户组和分配角色权限,用户组选择superGroup,角色建议全选,然后根据页面提示完成用户的创建。
- MRS 3.1.0及之后版本集群,所创建的用户至少需具备Manager_viewer的角色权限才能在管理中心创建连接;如果需要对应组件进行库、表、数据的操作,还需要添加对应组件的用户组权限。
- MRS 3.1.0版本之前的集群,所创建的用户需要具备Manager_administrator或System_administrator权限,才能在管理中心创建连接。
- 仅具备Manager_tenant或Manager_auditor权限,无法创建连接。
- 使用新建的用户登录Manager页面,并更新初始密码,否则会导致创建连接失败。
- 同步IAM用户。
- 登录MRS管理控制台。
- 选择“集群列表 > 现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
- 在“概览”页签的基本信息区域,单击“IAM用户同步”右侧的“同步”进行IAM用户同步。
- 如果显示为“已同步”,则可忽略本操作。
- 当IAM用户的用户组的所属策略从MRS ReadOnlyAccess向MRS CommonOperations、MRS FullAccess、MRS Administrator变化时,由于集群节点的SSSD(System Security Services Daemon)缓存刷新需要时间,因此同步完成后,请等待5分钟,等待新修改策略生效之后,再进行提交作业。否则,会出现提交作业失败的情况。
- 当IAM用户的用户组的所属策略从MRS CommonOperations、MRS FullAccess、MRS Administrator向MRS ReadOnlyAccess变化时,由于集群节点的SSSD缓存刷新需要时间,因此同步完成后,请等待5分钟,新修改策略才能生效。
针对MRS 2.x及之前版本集群 :
- 使用admin账户登录MRS Manager页面。
- 在Manager页面的“系统设置”中,单击“密码策略配置”,修改密码策略。
- “密码有效期(天)”配置为“0”,表示永不过期。
- “密码失效提前提醒天数”配置为“0”。
- 其他参数保持默认即可。
- 在MRS Manager页面的“系统设置”中,单击“用户管理”,在用户管理页面,添加用户,添加一个专有的人机用户作为kerberos认证用户,并且为这个用户添加用户组和分配角色权限,用户组选择superGroup,角色建议全选,然后根据页面提示完成用户的创建。
- MRS 2.x及之前版本集群,所创建的用户需要具备Manager_administrator或System_administrator权限,才能在管理中心创建连接。
- 仅具备Manager_tenant或Manager_auditor权限,无法创建连接。
- 使用新建的用户登录MRS Manager页面,并更新初始密码,否则会导致创建连接失败。
- 同步IAM用户。
- 登录MRS管理控制台。
- 选择“集群列表 > 现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
- 在“概览”页签的基本信息区域,单击“IAM用户同步”右侧的“同步”进行IAM用户同步。
- 如果显示为“已同步”,则可忽略本操作。
- 当IAM用户的用户组的所属策略从MRS ReadOnlyAccess向MRS CommonOperations、MRS FullAccess、MRS Administrator变化时,由于集群节点的SSSD(System Security Services Daemon)缓存刷新需要时间,因此同步完成后,请等待5分钟,等待新修改策略生效之后,再进行提交作业。否则,会出现提交作业失败的情况。
- 当IAM用户的用户组的所属策略从MRS CommonOperations、MRS FullAccess、MRS Administrator向MRS ReadOnlyAccess变化时,由于集群节点的SSSD缓存刷新需要时间,因此同步完成后,请等待5分钟,新修改策略才能生效。
配置MRS集群元数据实时同步功能
元数据实时同步功能需要在MRS集群内手动开启,并绑定已授权DAYU User权限的委托用于元数据同步鉴权。
开启元数据实时同步功能
- 使用admin账户登录MRS服务的Manager页面。
- 在Manager页面选择“集群 > 服务 > Hive > 配置 > 全部配置”,在搜索框中分别输入表2中的参数名,配置相应参数,如图2所示。
表2 配置参数一览表 参数名
取值
配置目的
Hive->MetaStore
hive.metastore.customized.configs
- 名称:com.huawei.cloud.dataarts.endpoint
- 值:DataArts Studio数据地图组件的终端节点Endpoint
终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同。本服务的Endpoint可从终端节点Endpoint获取。
(必选)开启元数据实时同步能力
- 名称:hive.metastore.event.listeners
- 值:com.huawei.cloud.dii.catalog.agent.listener.MrsMetaStoreEventListener
Hive->HiveServer
hive.stats.autogather
true
(可选)开启元数据统计能力
hive.security.authorization.sqlstd.confwhitelist
在原有取值后补充“,hive.exec.pre.hooks”
(可选)开启支持最近访问时间能力
hive.server.customized.configs
- 名称:hive.exec.pre.hooks
- 值:org.apache.hadoop.hive.ql.security.authorization.plugin.DisallowTransformHook,org.apache.hadoop.hive.ql.hooks.UpdateInputAccessTimeHook$PreExec
- 表2中的参数均配置完成后,单击左上角的“保存”,在弹窗中单击“确定”保存配置。
图3 保存配置
- 保存成功后,切换到实例页签,选择配置已过期的实例后,单击“更多 > 滚动重启实例”,使配置生效。
图4 滚动重启实例
授权并绑定委托
- 登录IAM服务控制台。
- 选择“委托”,在委托列表中查找MRS预置的MRS_ECS_DEFAULT_AGENCY委托,并单击“授权”。
如果未找到MRS预置的MRS_ECS_DEFAULT_AGENCY委托,则可以通过自定义购买方式来购买MRS集群,在高级配置中选择绑定MRS_ECS_DEFAULT_AGENCY委托。MRS集群开始创建后,会自动生成MRS_ECS_DEFAULT_AGENCY委托。
图5 授权委托
- 在授权页面中,在搜索框中输入“DAYU”,勾选DAYU User权限。
图6 选择权限
- 选择权限后,单击“下一步”设置授权范围。本例以默认选项为例,直接单击“确定”完成委托授权。
- 在MRS服务控制台,选择“集群列表 > 现有集群”,单击集群名进入待配置集群的详情页面。
- 在集群详情的概览页面,找到“运维管理”区域,确认集群已绑定MRS_ECS_DEFAULT_AGENCY委托。如果未绑定,需要手动选择MRS_ECS_DEFAULT_AGENCY委托并确认,完成绑定。
图7 绑定委托

