创建MRS数据源连接
操作场景
GaussDB(DWS)从MRS的HDFS读取数据前,需要先创建一个MRS数据源连接,作为GaussDB(DWS)集群与MRS集群的数据通道。
对系统的影响
- 一个GaussDB(DWS)集群在创建MRS数据源连接时,不能同时创建两个连接。
- 创建MRS数据源连接时,系统默认自动为GaussDB(DWS)集群和MRS集群的安全组增加出规则和入规则,允许相同子网中节点的访问。
- 启用Kerberos认证的MRS集群,系统会自动增加一个类型为“机机”的用户,属于“supergroup”用户组。
前提条件
- GaussDB(DWS)集群已创建好,并记录集群所在的虚拟私有云和子网。
- 创建MRS数据源连接需要创建MRS集群类型为分析集群。
操作步骤
- 登录华为云管理控制台。
- 打开MRS管理控制台,创建MRS集群。
创建集群时,请按要求配置以下参数,其他配置无特别要求,具体操作请参见《MapReduce服务用户指南》中的“自定义创建集群”章节:
- MRS集群的虚拟私有云需要和GaussDB(DWS)集群相同。
- MRS集群版本,支持版本如下所示:
- 8.1.1.300及以上版本集群,MRS集群支持连接1.6.*、1.7.*、1.8.*、1.9.*、2.0.*、3.0.*、3.1.*、3.2.*、3.3.*及以上版本(“*”代表的是数字)。
- 8.1.1.300以下版本集群,MRS集群支持连接1.6.*、1.7.*、1.8.*、1.9.*、2.0.*版本(“*”代表的是数字)。
- 组件选择,需要选择Hadoop组件。
如果已有符合如上条件的MRS集群,则可跳过此步骤。
- 打开GaussDB(DWS)管理控制台,进入GaussDB(DWS)管理控制台页面。
- 在GaussDB(DWS)管理控制台,选择“集群 > 专属集群”。
- 在集群列表中单击指定集群的名称,进入“集群详情”页面。
- 在左侧导航栏,选择“数据源>MRS数据源”页签。
- 单击“创建MRS数据源连接”,填写配置参数。
图1 创建MRS数据源连接
表1 MRS连接公共参数说明 参数名
说明
数据源名称
对应GaussDB(DWS)数据库server名称,包含小写字母、数字或者下划线,且必须以小写字母开头,长度为3到63个字符。
配置方式
表示配置时系统获取文件使用的方式:
数据库
数据源所在数据库。
描述
表示此连接的说明信息。
表2 MRS用户方式参数配置说明 参数名
说明
MRS数据源
下拉框选择GaussDB(DWS)可连接的MRS集群。默认显示当前用户可连接的,即与当前GaussDB(DWS)集群在相同虚拟私有云和子网下且为可用状态的自定义型、混合型以及分析型MRS集群。
选择一个MRS集群后,将自动显示已选择的MRS是否启用了Kerberos认证。单击“查看MRS集群”可进入MRS查看该MRS集群信息。
如果“MRS数据源”下拉框为空,用户可以单击“创建MRS集群”进行创建。
MRS用户
GaussDB(DWS)集群连接MRS集群时使用的用户名。
用户密码
填写连接用户的密码。如果用户密码被修改,则需要重新创建连接。
须知:用户密码必须成功登录过MRS Manager,新用户使用初始密码第一次登录MRS Manager时会提示修改密码,这种情况会导致配置MRS数据源失败。
使用机机账号
开启后,会自动在MRS创建一个名称为dws的机机账号用于后续dws数据库和MRS的交互,该机机账号固定为supergroup组,拥有所有权限;若关闭,则直接将配置的人机用户用于dws数据库和MRS交互,需要保证用户拥有数据权限,否则在使用数据源时会提示文件不存在。
- 单击“提交”保存连接。
创建连接需要一段时间,此时“配置状态”显示为“创建中”,成功后在MRS数据源列表中可看到已创建的连接,且状态为“可用”。
- 在“操作”列,可以单击“更新配置”,更新当前连接的“MRS集群状态”和“配置状态”。在更新配置时,无法创建新的连接,且会检查安全组规则是否正常并自助修复。具体请参见更新MRS数据源配置。
- 在“操作”列,可以单击“删除”将不再使用的连接删除释放。删除连接时,不会自动删除安全组规则,请根据需要手工删除。
- 安全组规则若不删除,DWS集群中的节点与MRS集群中的节点网络仍是互通的。如果用户对网络安全要求较严格,建议手动删除安全组规则。