配置Hive连接
MRS Hive
用户具有MRS Hive连接的表的访问权限时,才能在字段映射时看到表。
MRS Hive连接适用于华为云MapReduce服务。MRS Hive的连接参数如表1所示。

- 新建MRS连接前,需在MRS中添加一个kerberos认证用户并登录MRS管理页面更新其初始密码,然后使用该新建用户创建MRS连接。
- 如需连接MRS 2.x版本的集群,请先创建2.x版本的CDM集群。CDM 1.8.x版本的集群无法连接MRS 2.x版本的集群。
- 由于当前CDM Hive连接是从MRS HDFS组件获取core-site.xml配置信息,所以在MRS侧使用的是Hive over OBS场景时,在创建Hive连接前,需要用户在MRS管理界面的HDFS组件中配置OBS的AK、SK信息。
参数名 |
说明 |
取值样例 |
---|---|---|
名称 |
连接的名称,根据连接的数据源类型,用户可自定义便于记忆、区分的连接名。 |
hivelink |
Manager IP |
MRS Manager的浮动IP地址,可以单击输入框后的“选择”来选定已创建的MRS集群,CDM会自动填充下面的鉴权参数。 |
127.0.0.1 |
认证类型 |
访问MRS的认证类型:
|
SIMPLE |
Hive版本 |
Hive的版本。根据服务端Hive版本设置。 |
HIVE_3_X |
用户名 |
选择KERBEROS鉴权时,需要配置MRS Manager的用户名和密码。从HDFS导出目录时,如果需要创建快照,这里配置的用户需要HDFS系统的管理员权限。 如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以创建一个新的MRS用户,然后在创建MRS数据连接时,“用户名”和“密码”填写为新建的MRS用户及其密码。 |
cdm |
密码 |
访问MRS Manager的用户密码。 |
- |
OBS支持 |
需服务端支持OBS存储。在创建Hive表时,您可以指定将表存储在OBS中。 |
否 |
运行模式 |
“HIVE_3_X”版本支持该参数。支持以下模式: |
EMBEDDED |
是否使用集群配置 |
您可以通过使用集群配置,简化Hadoop连接参数配置。 |
否 |
集群配置名 |
仅当“是否使用集群配置”为“是”时,此参数有效。此参数用于选择用户已经创建好的集群配置。 集群配置的创建方法请参见管理集群配置。 |
hive_01 |
单击“显示高级属性”,然后单击“添加”,您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性,可单击属性后的“删除”按钮进行删除。
FusionInsight Hive
FusionInsight Hive连接适用于用户在本地数据中心自建的FusionInsight HD,需通过专线连接。
FusionInsight Hive的连接参数如表2所示。
参数名 |
说明 |
取值样例 |
---|---|---|
名称 |
连接的名称,根据连接的数据源类型,用户可自定义便于记忆、区分的连接名。 |
hivelink |
Manager IP |
MRS Manager的浮动IP地址,可以单击输入框后的“选择”来选定已创建的MRS集群,CDM会自动填充下面的鉴权参数。 |
127.0.0.1 |
Manager端口 |
FusionInsight/MRS Manager端口。 |
28443 |
CAS Server端口 |
FusionInsight/MRS Manager CAS协议端口。 |
20009 |
认证类型 |
访问MRS的认证类型:
|
SIMPLE |
Hive版本 |
Hive的版本。 |
HIVE_3_X |
用户名 |
选择KERBEROS鉴权时,需要配置MRS Manager的用户名和密码。从HDFS导出目录时,如果需要创建快照,这里配置的用户需要HDFS系统的管理员权限。 |
cdm |
密码 |
访问MRS Manager的用户密码。 |
- |
OBS支持 |
需服务端支持OBS存储。在创建Hive表时,您可以指定将表存储在OBS中。 |
否 |
运行模式 |
“HIVE_3_X”版本支持该参数。支持以下模式: |
EMBEDDED |
是否使用集群配置 |
您可以通过使用集群配置,简化Hadoop连接参数配置。 |
否 |
集群配置名 |
仅当“是否使用集群配置”为“是”时,此参数有效。此参数用于选择用户已经创建好的集群配置。 集群配置的创建方法请参见管理集群配置。 |
hive_01 |
单击“显示高级属性”,然后单击“添加”,您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性,可单击属性后的“删除”按钮进行删除。
Apache Hive
Apache Hive连接适用于用户在本地数据中心或ECS上自建的第三方Hadoop,其中本地数据中心的Hadoop需通过专线连接。
Apache Hive的连接参数如表3所示。
参数名 |
说明 |
取值样例 |
---|---|---|
名称 |
连接的名称,根据连接的数据源类型,用户可自定义便于记忆、区分的连接名。 |
hivelink |
URI |
NameNode URI地址。 |
hdfs://hacluster |
Hive元数据地址 |
设置Hive元数据地址,参考 hive.metastore.uris配置项。例如:thrift://host-192-168-1-212:9083 |
- |
认证类型 |
访问MRS的认证类型:
|
SIMPLE |
Hive版本 |
Hive的版本。 |
HIVE_3_X |
IP与主机名映射 |
如果Hadoop配置文件使用主机名,需要配置IP与主机的映射。格式:IP与主机名之间使用空格分隔,多对映射使用分号或回车换行分隔。 |
- |
OBS支持 |
需服务端支持OBS存储。在创建Hive表时,您可以指定将表存储在OBS中。 |
否 |
运行模式 |
“HIVE_3_X”版本支持该参数。支持以下模式: |
EMBEDDED |
是否使用集群配置 |
您可以通过使用集群配置,简化Hadoop连接参数配置。 |
否 |
集群配置名 |
仅当“是否使用集群配置”为“是”时,此参数有效。此参数用于选择用户已经创建好的集群配置。 集群配置的创建方法请参见管理集群配置。 |
hive_01 |
单击“显示高级属性”,然后单击“添加”,您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性,可单击属性后的“删除”按钮进行删除。
