更新时间:2024-03-25 GMT+08:00

创建增强型跨源连接

操作场景

使用DLI访问其他数据源的数据前,首先要通过建立增强型跨源连接打通DLI和数据源之间的网络,DLI才能够访问、导入、查询、分析其他数据源的数据。

例如:DLI连接MRS、RDS、CSS、Kafka、DWS时,需要打通DLI和对应数据源VPC之间的网络,才能实现数据互通。

本节操作介绍在控制台创建增强型跨源连接的操作步骤。

约束和限制

  • DLI提供的default队列不支持创建跨源连接。
  • Flink作业访问DIS,OBS和SMN数据源,无需创建跨源连接,可以直接访问。
  • 增强型跨源仅支持包年包月队列、按需计费模式下的专属队列。
  • 增强型跨源连接需要使用VPC、子网、路由、对等连接功能,因此需要获得VPC(虚拟私有云)的VPC Administrator权限。

    可在服务授权中进行设置。

  • 使用DLI增强型跨源时,弹性资源池/队列的网段与数据源网段不能重合。
  • 访问跨源表需要使用已经创建跨源连接的队列。
  • 跨源表不支持Preview预览功能。
  • 检测跨源连接的连通性时对IP约束限制如下:
    • IP必须为合法的IP地址,用“.”分隔的4个十进制数,范围是0-255。
    • 测试时IP地址后可选择添加端口,用":"隔开,端口最大限制5位,端口范围:0~65535。

      例如192.168.xx.xx或者192.168.xx.xx:8181。

  • 检测跨源连接的连通性时对域名约束限制如下:
    • 域名的限制长度为1到255的字符串,并且组成必须是字母、数字、下划线或者短横线。
    • 域名的顶级域名至少包含两个及以上的字母,例如.com,.net,.cn等。
    • 测试时域名后可选择添加端口,用":"隔开,端口最大限制为5位,端口范围:0~65535。

      例如example.com:8080。

操作流程

图1 创建增强型跨源连接操作流程

前提条件

  • 已创建弹性资源池/队列用于绑定跨源连接。
  • 已获取外部数据源的虚拟私有云、子网、内网IP、端口和安全组信息。
  • 外部数据源的安全组已放通弹性资源池/队列的网段。

操作步骤

  1. 创建增强型跨源连接

    1. 登录DLI管理控制台。
    2. 在左侧导航栏中,选择“跨源管理 > 增强型跨源 ”
    3. 选择“增强型跨源”,单击“创建”。

      配置增强型跨源连接信息,详细参数介绍请参见表1

      表1 参数说明

      参数

      参数说明

      连接名称

      所创建的跨源连接名称。

      • 名称只能包含数字、英文字母、下划线。不能为空。
      • 输入长度不能超过64个字符。

      弹性资源池

      可选参数,用于绑定使用跨源连接的弹性资源池或队列。

      仅包周期和按需计费模式的专属队列支持绑定弹性资源池。

      已上线弹性资源池的region,在队列管理中创建的队列会默认创建同名的资源池。

      说明:

      使用增强型跨源连接之前必须绑定队列且对等连接的状态是“active”。

      绑定队列

      可选参数,用于绑定需要使用跨源的队列。

      仅包周期和按需计费模式的专属队列支持绑定弹性资源池。

      说明:

      使用增强型跨源连接之前必须绑定队列且对等连接的状态是“active”。

      虚拟私有云

      数据源所使用的虚拟私有云。

      子网

      数据源所使用的子网。

      路由表

      显示子网实际绑定的路由表。

      说明:
      • 此处的路由表为目的数据源子网关联的路由表,不同于“路由信息”中的路由。“路由信息”中的路由为所绑定的队列下子网关联的路由表中的路由。
      • 目的数据源子网与队列所在子网为不同的子网,否则会造成网段冲突。

      主机信息

      可选参数,用于配置主机的IP与域名的映射关系,在作业配置时只需使用配置的域名即可访问对应的主机。

      例如:访问MRS的HBase集群时需要配置Zookeeper实例的主机名(即域名)与对应的IP地址。每行填写一条记录,填写格式为:“IP 主机名/域名”。

      示例:

      192.168.0.22 node-masterxxx1.com

      192.168.0.23 node-masterxxx2.com

      获取主机信息的方法请参考怎样获取MRS主机信息?

      标签

      使用标签标识云资源。包括标签键和标签值。如果您需要使用同一标签标识多种云资源,即所有服务均可在标签输入框下拉选择同一标签,建议在标签管理服务(TMS)中创建预定义标签。

      如您的组织已经设定DLI的相关标签策略,则需按照标签策略规则为资源添加标签。标签如果不符合标签策略的规则,则可能会导致资源创建失败,请联系组织管理员了解标签策略详情。

      具体请参考《标签管理服务用户指南》。

      说明:
      • 最多支持20个标签。
      • 一个“键”只能添加一个“值”。
      • 每个资源中的键名不能重复。
      • 标签键:在输入框中输入标签键名称。
        说明:

        标签的键的最大长度为128个字符,标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格,不能以_sys_开头。

      • 标签值:在输入框中输入标签值。
        说明:

        标签值的最大长度为255个字符,标签的值可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格。

    4. 单击“确定”,创建增强型跨源连接。

      创建完成后,增强型跨源连接的链接状态显示“已激活”,代表该链接创建成功。

  2. 数据源所在安全组放通弹性资源池的网段

    1. 在DLI管理控制台,获取弹性资源池/队列的网段。

      单击“资源管理 > 队列管理”,选择运行作业的队列,单击队列名称旁的按钮,获取队列的网段信息。

    2. 登录VPC控制台。找到数据源所在的VPC。
    3. 查找安全组名称,在“弹性网卡 > 更多 > 更改安全组”中可以查到所属安全组。
    4. 在左侧导航树选择“访问控制 > 安全组”。
    5. 单击外部数据源所属的安全组名称,进入安全组详情界面。
    6. 在“入方向规则”页签中添加放通队列网段的规则。如图2所示。

      详细的入方向规则参数说明请参考表2

      图2 添加入方向规则
      表2 入方向规则参数说明

      参数

      说明

      取值样例

      优先级

      安全组规则优先级。

      优先级可选范围为1-100,默认值为1,即最高优先级。优先级数字越小,规则优先级级别越高。

      1

      策略

      安全组规则策略。

      允许

      协议端口

      • 网络协议。目前支持“All”、“TCP”、“UDP”、“ICMP”和“GRE”等协议。
      • 端口:允许远端地址访问指定端口,取值范围为:1~65535。

      本例中选择TCP协议,端口值不填或者填写为数据源的端口。

      类型

      IP地址类型。

      IPV4

      源地址

      源地址用于放通来自IP地址或另一安全组内的实例的访问。

      本例填写获取的队列网段。

      描述

      安全组规则的描述信息,非必填项。

      _

  3. 测试DLI队列与数据源的连通性

    1. 获取数据源的私有内网IP和端口。

      以RDS数据源为例:在RDS控制台“实例管理”页面,单击对应实例名称,查看“连接信息”>“内网地址”,即可获取RDS内网地址。查看“连接信息”>“数据库端口”,获取RDS数据库实例端口。

    2. 在DLI管理控制台,单击“资源管理 > 队列管理”。
    3. 选择增强型跨源所绑定的队列,单击操作列“更多 > 测试地址连通性”。
    4. 输入数据源连接地址和端口,测试网络连通性。

      格式:IP:端口

      测试连接前,请确保外部数据源的安全组已放通队列的网段。

      图3 测试队列与数据源的网络连通性