配置Power BI连接DLI进行数据查询和分析
Power BI提供了数据集成、数据仓库、报告和数据可视化等功能,能够将复杂的数据转换为易于理解和交互的可视化图表和仪表板,从而帮助企业做出基于数据的决策。
将Power BI与DLI连接进行数据查询和分析,简化了数据访问流程,提供了数据的统一管理和分析能力,从而获得更深入的数据洞察。
本节操作介绍PowerBI连接DLI,以访问和分析DLI中的数据的操作步骤。
操作前准备
- 环境要求:
确保您的系统环境满足以下要求。
- 操作系统:仅支持Windows 10, Windows 11版本x64位操作系统。
- Power BI不支持解析复杂类型字段:Map、Struct、Array。
- 工具包:
- DLI的ODBC驱动:dli-odbc-xxx-setup-x64.exe
- PowerBI安装包:PowerBI安装包,请选择Windows X64位系统的安装包。
- 准备连接信息
表1 连接信息 类别
说明
获取方式
DLI AKSK
AK/SK认证就是使用AK/SK对请求进行签名,从而通过身份认证。
DLI Endpoint地址
地区与终端节点,即云服务在不同Region有不同的访问域名。
DLI所在的项目ID
项目编号,用于资源隔离。
DLI区域信息
DLI所属区域信息
步骤1:配置ODBC
- 安装ODBC驱动
- 参考操作前准备获取ODBC安装包。
- 双击dli-odbc-xxx-setup-x64.exe安装ODBC驱动包。
安装完成后会自动生成一个Path环境变量, 切勿删除该环境变量。
- 配置ODBC连接DLI
- 在Windows系统中,打开“控制面板 > 管理工具 > ODBC数据源 (64位)”。
- 配置新的ODBC数据源。
- 在ODBC中单击“User DSN”。
- 单击“Add”创建新的数据源。
- 选择Huawei Cloud DLI Driver (64-bit),单击“OK”。
图1 ODBC新建数据源连接 - 在创建的新数据源配置界面中,输入ODBC连接DLI的相关信息。
表2 PowerBI连接DLI参数说明 参数
是否必选
说明
配置样例
Data Source Name (DSN)
是
自定义的DSN名字。
-
DLI Server Region (REGION)
是
DLI的区域ID。
cn-north-4
DLI Server Host (HOST)
是
DLI的Endpoint地址。
dli. {REGION}.{domainName}
dli.cn-north-4.myhuaweicloud.com
Project ID (PROJECTID)
是
DLI资源所在的项目ID。
0b33ea2a7e0010802fe4c009bb05076d
Access Key (AK)
是
AK/SK认证密钥。
-
Secret Key (SK)
是
AK/SK认证密钥。
-
Database Name (DATABASE)
是
DLI数据库名称。
dli
Queue Name (QUEUENAME)
是
DLI服务的队列名称(当前只支持spark sql引擎队列)。
dli_test
Obs EndPoint (OBSENDPOINT)
是
OBS的Endpoint地址。
obs.{REGION}.{domainName}
obs.cn-north-4.myhuaweicloud.com
Extra Configuration (KEY=VALUE;)
否
其他配置参数:
例如:
- JOBTIMEOUT指定SQL最长运行时间,超时取消(不设置默认就是3600秒);
- spark.sql.shuffle.partitions是spark运行参数
JOBTIMEOUT=3600; spark.sql.shuffle.partitions=100;
图2 ODBC配置数据源连接信息 - 单击“Test”测试数据源连接是否成功,如果连接正常单击“OK”保存连接。
步骤2:配置Power BI使用ODBC连接到DLI
- 单击并安装PowerBI。获取PowerBI安装包,请选择Windows X64位系统的安装包。
- 打开Power BI Desktop。
- 单击“主页”选项卡下的“获取数据”按钮。
- 在“获取数据”窗口中,选择“更多...”以查看其他数据源选项。
- 从列表中选择“ODBC”作为数据源类型,然后单击“连接”。
- 在弹出的“ODBC驱动管理器”窗口中,选择步骤1:配置ODBC配置的ODBC数据源名称,单击“确定”。
Power BI将使用ODBC连接到DLI,并允许您预览和选择数据库中的表和视图。
在预览库表时请选择limit,否则分区表将全表扫描。