更新时间:2024-09-27 GMT+08:00
分享

Doris数据连接参数说明

表1 Doris数据连接

参数

是否必选

说明

数据连接类型

Doris连接固定选择为Doris。

数据连接名称

数据连接的名称,只能包含字母、数字、下划线和中划线,且长度不超过100个字符。

标签

标识数据连接的属性。设置标签后,便于统一管理。
说明:

标签的名称,只能包含中文、英文字母、数字和下划线,不能以下划线开头,且长度不能超过100个字符。

适用组件

选择此连接适用的组件。勾选组件后,才能在相应组件内使用本连接。

说明:
  • 当开启数据集成作业特性后,可勾选数据集成组件,勾选后在数据开发组件创建集成作业时支持选择本数据连接。
  • 离线处理集成作业功能当前需申请白名单后才能使用。如需使用该特性,请联系客服或技术支持人员

基础与网络连通配置

Doris类型

可选择MRS Doris和CloudTable Doris。

MRS集群名

当选择MRS Doris时有效。

说明:

目前仅支持MRS 3.2.0及以上MRS集群版本。

选择所属的MRS集群。仅支持连接MRS云服务,自建Hadoop集群必须在纳管到MRS云服务后才可以选择。系统会显示所有项目ID和企业项目相同的MRS集群。
说明:

当前DataArts Studio不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群,请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。

如果选择集群后连接失败,请检查MRS集群与作为Agent的CDM实例是否网络互通。网络互通需满足如下条件:
  • DataArts Studio实例(指DataArts Studio实例中的CDM集群)与MRS集群处于不同区域的情况下,需要通过公网或者专线打通网络。通过公网互通时,需确保CDM集群已绑定EIP,MRS集群可以访问公网且防火墙规则已开放连接端口。
  • DataArts Studio实例(指DataArts Studio实例中的CDM集群)与MRS集群同区域情况下,同虚拟私有云、同子网、同安全组的不同实例默认网络互通;如果同虚拟私有云但子网或安全组不同,还需配置路由规则及安全组规则,配置路由规则请参见如何配置路由规则章节,配置安全组规则请参见如何配置安全组规则章节。
  • 此外,还需确保该MRS集群与DataArts Studio工作空间所属的企业项目相同,如果不同,您需要修改工作空间的企业项目。
说明:

当同一Agent连接多个MRS集群时,如果其中一个MRS集群被删除或状态异常,会影响另外一个正常的MRS集群数据连接。因此建议一个Agent对应一个MRS集群数据连接。

FE IP

MRS集群Doris或者Cloud组件frontend节点的IP,可以填写一个或多个IP。如果有多个ip用“,”分隔。

获取方法:

  1. 登录MRS FusionInsight Manager。
  2. 选择“集群 > 服务 > Doris > 实例”,获取FE角色的管理IP。

端口

Doris FE通过mysql协议查询连接端口。

MRS Doris获取方法:

  1. 登录MRS FusionInsight Manager。
  2. 选择“集群 > 服务 > Doris > 配置 > 基础配置”,搜索“query_port”查看端口值。

KMS密钥

通过KMS加解密数据源认证信息,选择KMS中的任一默认密钥或自定义密钥即可。
说明:

第一次通过DataArts Studio或KPS使用KMS加密时,会自动生成默认密钥dlf/default或kps/default。关于默认密钥的更多信息,请参见什么是默认密钥

绑定Agent

MRS为非全托管服务,DataArts Studio无法直接与非全托管服务进行连接。CDM集群提供了DataArts Studio与非全托管服务通信的代理,所以创建MRS的数据连接时,请选择一个CDM集群。如果没有可用的CDM集群,请先进行创建。

CDM集群作为网络代理,必须和MRS集群网络互通才可以成功创建MRS连接,为确保两者网络互通,CDM集群必须和MRS集群处于相同的区域、可用区,且使用同一个VPC和子网,安全组规则需允许两者网络互通。

说明:
  • CDM集群作为管理中心数据连接Agent时,单集群无法连接多个MRS安全集群。建议您按照业务情况规划多个Agent与MRS安全集群一一映射。
  • CDM集群作为管理中心数据连接Agent时,单集群的并发活动线程最大为200。即当多个数据连接共用同一Agent时,通过这些数据连接提交SQL脚本、Shell脚本、Python脚本等任务的同时运行上限为200,超出的任务将排队等待。建议您按照业务量情况规划多个Agent分担压力。

SSL加密

支持对RDS服务启用SSL加密传输。默认开启SSL,如源端SSL未开启,则需手动关闭SSL加密。

数据源驱动配置

驱动程序名称

驱动程序名称,目前支持MySQL jdbc驱动,驱动名为:com.mysql.jdbc.Driver。

驱动文件来源

选择驱动文件的来源方式。

驱动文件路径

“驱动文件来源”选择“OBS路径”时配置。

驱动文件在OBS上的路径。需要您自行到官网下载.jar格式驱动并上传至OBS中。

MySQL驱动:获取地址https://downloads.mysql.com/archives/c-j/,建议5.1.48版本及以上版本,如果低于5.1.48版本则连接会报错“The db user or password invalid”。

说明:

如果需要更新驱动文件,则需要先在数据集成页面重启CDM集群,然后通过编辑数据连接的方式重新选择新版本驱动,更新驱动才能生效。

驱动文件

“驱动文件来源”选择“本地文件”时配置。不同类型的关系数据库,需要适配不同类型的驱动。

数据源认证及其他功能配置

用户名

MRS集群或CloudTable集群的用户名。

如果使用新建的MRS用户进行连接,您需要先登录Manager页面,并更新初始密码。

如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以参考创建MRS安全集群的kerberos认证用户创建一个新的密码永不过期MRS用户,然后在创建MRS数据连接时,“用户名”和“密码”填写为新建的MRS用户及其密码。

说明:
  • MRS 3.1.0及之后版本集群,所创建的用户至少需具备Manager_viewer的角色权限才能在管理中心创建连接;如果需要对应组件的进行库、表、数据的操作,还需要添加对应组件的用户组权限。
  • MRS 3.1.0版本之前的集群,所创建的用户需要具备Manager_administrator或System_administrator权限,才能在管理中心创建连接。
  • 仅具备Manager_tenant或Manager_auditor权限,无法创建连接。
  • 建议用户名的密码策略设置为永不过期,避免由于密码过期导致连接失败,引起业务受损。

密码

MRS集群或CloudTable集群的访问密码。

数据集成配置

stream load 端口

配置需要连接的stream load 端口。

数据库名称

配置需要连接的数据库。

当“适用组件”勾选“数据集成”时,参数“数据库名称”到“引用符号”才需要配置,其中数据库名称为必填项。

使用本地API

开关开启时,使用本地API加速。

开关关闭时,不使用本地API加速。

使用数据库本地API加速。(系统会尝试启用MySQL数据库的local_infile系统变量)

单次请求行数

指定单次请求获取的行数。默认1000。

单次提交行数

指定单次批量提交的行数。默认10000。

单次写入行数

指定单次请求写入的行数。

连接属性

单击“添加”,可配置属性名称和属性值,大小不超过512个字符。单击“删除”可以删除已配置的属性信息。

举例如下:

  • socketTimeout:配置JDBC连接超时时间,单位为毫秒。
  • mysql.bool.type.transform:配置mysql读取时,是否将tinyint(1)解析成boolean类型,默认为true。

引用符号

配置引用符号,例如"。

数据库包围标识符。对某些数据库意味着大小写敏感,如不需用请置空。

检查streamLoad连通性

测试Doris streamLoad连通性,当使用场景通过streamLoad方式写数据的时候时,需要保证该连通正常。

创建MRS安全集群的kerberos认证用户

如果要创建MRS安全集群的数据连接,不能使用admin用户。因为admin用户是默认的管理页面用户,这个用户无法作为安全集群的认证用户来使用。您可以参考以下步骤创建一个新的MRS用户:

针对MRS 3.x版本集群:

  1. 使用admin账户登录MRS服务的Manager页面。
  2. 在Manager页面选择“系统 > 权限 > 安全策略 > 密码策略”,单击“新增密码策略”,添加一个永不过期的密码策略。
    • “密码策略名”可配置为“neverexp”。
    • “密码有效期(天)”配置为“0”,表示永不过期。
    • “密码失效提前提醒天数”配置为“0”。
    • 其他参数保持默认即可。
  3. 在Manager页面选择“系统 > 权限 > 用户”,单击“添加用户”,添加一个专有用户作为kerberos认证用户,密码策略选择为永不过期策略“neverexp”,并且为这个用户添加用户组和分配角色权限,用户组选择superGroup,角色建议全选,然后根据页面提示完成用户的创建。
    • MRS 3.1.0及之后版本集群,所创建的用户至少需具备Manager_viewer的角色权限才能在管理中心创建连接;如果需要对应组件的进行库、表、数据的操作,还需要添加对应组件的用户组权限。
    • MRS 3.1.0版本之前的集群,所创建的用户需要具备Manager_administrator或System_administrator权限,才能在管理中心创建连接。
    • 仅具备Manager_tenant或Manager_auditor权限,无法创建连接。
  4. 使用新建的用户登录Manager页面,并更新初始密码,否则会导致创建连接失败。
  5. 同步IAM用户。
    1. 登录MRS管理控制台。
    2. 选择“集群列表 > 现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
    3. 在“概览”页签的基本信息区域,单击“IAM用户同步”右侧的“同步”进行IAM用户同步。
      • 当IAM用户的用户组的所属策略从MRS ReadOnlyAccess向MRS CommonOperations、MRS FullAccess、MRS Administrator变化时,由于集群节点的SSSD(System Security Services Daemon)缓存刷新需要时间,因此同步完成后,请等待5分钟,等待新修改策略生效之后,再进行提交作业。否则,会出现提交作业失败的情况。
      • 当IAM用户的用户组的所属策略从MRS CommonOperations、MRS FullAccess、MRS Administrator向MRS ReadOnlyAccess变化时,由于集群节点的SSSD缓存刷新需要时间,因此同步完成后,请等待5分钟,新修改策略才能生效。

针对MRS 2.x及之前版本集群 :

  1. 使用admin账户登录MRS Manager页面。
  2. 在Manager页面的“系统设置”中,单击“密码策略配置”,修改密码策略。
    • “密码有效期(天)”配置为“0”,表示永不过期。
    • “密码失效提前提醒天数”配置为“0”。
    • 其他参数保持默认即可。
  3. 在MRS Manager页面的“系统设置”中,单击“用户管理”,在用户管理页面,添加用户,添加一个专有用户作为kerberos认证用户,并且为这个用户添加用户组和分配角色权限,用户组选择superGroup,角色建议全选,然后根据页面提示完成用户的创建。
    • MRS 2.x及之前版本集群,所创建的用户需要具备Manager_administrator或System_administrator权限,才能在管理中心创建连接。
    • 仅具备Manager_tenant或Manager_auditor权限,无法创建连接。
  4. 使用新建的用户登录MRS Manager页面,并更新初始密码,否则会导致创建连接失败。
  5. 同步IAM用户。
    1. 登录MRS管理控制台。
    2. 选择“集群列表 > 现有集群”,选中一个运行中的集群并单击集群名称,进入集群信息页面。
    3. 在“概览”页签的基本信息区域,单击“IAM用户同步”右侧的“同步”进行IAM用户同步。
      • 当IAM用户的用户组的所属策略从MRS ReadOnlyAccess向MRS CommonOperations、MRS FullAccess、MRS Administrator变化时,由于集群节点的SSSD(System Security Services Daemon)缓存刷新需要时间,因此同步完成后,请等待5分钟,等待新修改策略生效之后,再进行提交作业。否则,会出现提交作业失败的情况。
      • 当IAM用户的用户组的所属策略从MRS CommonOperations、MRS FullAccess、MRS Administrator向MRS ReadOnlyAccess变化时,由于集群节点的SSSD缓存刷新需要时间,因此同步完成后,请等待5分钟,新修改策略才能生效。

相关文档