文档首页/ 数据湖探索 DLI/ 最佳实践/ 使用BI工具连接DLI分析数据/ 配置Power BI连接DLI进行数据查询和分析
更新时间:2025-04-28 GMT+08:00

配置Power BI连接DLI进行数据查询和分析

Power BI提供了数据集成、数据仓库、报告和数据可视化等功能,能够将复杂的数据转换为易于理解和交互的可视化图表和仪表板,从而帮助企业做出基于数据的决策。

将Power BI与DLI连接进行数据查询和分析,简化了数据访问流程,提供了数据的统一管理和分析能力,从而获得更深入的数据洞察。

本节操作介绍PowerBI连接DLI,以访问和分析DLI中的数据的操作步骤。

操作前准备

  • 环境要求:

    确保您的系统环境满足以下要求。

    • 操作系统:仅支持Windows 10, Windows 11版本x64位操作系统。
    • Power BI不支持解析复杂类型字段:Map、Struct、Array。
  • 工具包
  • 准备连接信息
    表1 连接信息

    类别

    说明

    获取方式

    DLI AKSK

    AK/SK认证就是使用AK/SK对请求进行签名,从而通过身份认证。

    获取AK/SK

    DLI Endpoint地址

    地区与终端节点,即云服务在不同Region有不同的访问域名。

    获取EndPoint

    DLI所在的项目ID

    项目编号,用于资源隔离。

    获取项目ID

    DLI区域信息

    DLI所属区域信息

    地区和终端节点

步骤1:配置ODBC

  1. 安装ODBC驱动

    1. 参考操作前准备获取ODBC安装包。
    2. 双击dli-odbc-xxx-setup-x64.exe安装ODBC驱动包。

      安装完成后会自动生成一个Path环境变量, 切勿删除该环境变量。

  2. 配置ODBC连接DLI

    1. 在Windows系统中,打开“控制面板 > 管理工具 > ODBC数据源 (64位)”。
    2. 配置新的ODBC数据源。
      1. 在ODBC中单击“User DSN”。
      2. 单击“Add”创建新的数据源。
      3. 选择Huawei Cloud DLI Driver (64-bit),单击“OK”。
      图1 ODBC新建数据源连接
    3. 在创建的新数据源配置界面中,输入ODBC连接DLI的相关信息。

      表2 PowerBI连接DLI参数说明

      参数

      是否必选

      说明

      配置样例

      Data Source Name (DSN)

      自定义的DSN名字。

      -

      DLI Server Region (REGION)

      DLI的区域ID。

      cn-north-4

      DLI Server Host (HOST)

      DLI的Endpoint地址。

      dli. {REGION}.{domainName}

      dli.cn-north-4.myhuaweicloud.com

      Project ID (PROJECTID)

      DLI资源所在的项目ID。

      0b33ea2a7e0010802fe4c009bb05076d

      Access Key (AK)

      AK/SK认证密钥。

      -

      Secret Key (SK)

      AK/SK认证密钥。

      -

      Database Name (DATABASE)

      DLI数据库名称。

      dli

      Queue Name (QUEUENAME)

      DLI服务的队列名称(当前只支持spark sql引擎队列)。

      dli_test

      Obs EndPoint (OBSENDPOINT)

      OBS的Endpoint地址。

      obs.{REGION}.{domainName}

      obs.cn-north-4.myhuaweicloud.com

      Extra Configuration (KEY=VALUE;)

      其他配置参数:

      例如:

      • JOBTIMEOUT指定SQL最长运行时间,超时取消(不设置默认就是3600秒);
      • spark.sql.shuffle.partitions是spark运行参数

      JOBTIMEOUT=3600; spark.sql.shuffle.partitions=100;

      图2 ODBC配置数据源连接信息
    4. 单击“Test”测试数据源连接是否成功,如果连接正常单击“OK”保存连接。

步骤2:配置Power BI使用ODBC连接到DLI

  1. 单击并安装PowerBI。获取PowerBI安装包,请选择Windows X64位系统的安装包。
  2. 打开Power BI Desktop。
  3. 单击“主页”选项卡下的“获取数据”按钮。
  4. 在“获取数据”窗口中,选择“更多...”以查看其他数据源选项。
  5. 从列表中选择“ODBC”作为数据源类型,然后单击“连接”。
  6. 在弹出的“ODBC驱动管理器”窗口中,选择步骤1:配置ODBC配置的ODBC数据源名称,单击“确定”。

    Power BI将使用ODBC连接到DLI,并允许您预览和选择数据库中的表和视图。

    在预览库表时请选择limit,否则分区表将全表扫描。