更新时间:2025-08-25 GMT+08:00
快速开始
以下代码使用ibis库连接DataArtsFabric数据湖并执行数据查询,将结果转换为DataFrame格式的基本语法。
示例仅供参考,请您根据实际情况进行修改。
关于Ibis更详细的用法,请参见Ibis官方文档。
import ibis # 导入ibis依赖 con = ibis.fabric.connect( # 调用DataArtsFabric后端连接,创建连接 endpoint=FABRIC_ENDPOINT, # 指定服务的区域,区域查询地区和终端节点。 endpoint_id=FABRIC_ENDPOINT_ID, # 查询endpoint_id,详情参见《API参考》手册的《附录》章节 domain=FABRIC_DOMAIN, #租户名 user=FABRIC_USER, #IAM用户名 password=FABRIC_PASS, #IAM密码 project_id=FABRIC_PROJECT_ID, # 如何获取project_id catelog_name=IBIS_TEST_FABRIC_CATELOG, #连接指定的Catalog workspace_id=FABRIC_WORKSPACE_ID, # 获取workspace_id,详情参见《API参考》手册的《附录》章节 lakeformation_instance_id=IBIS_TEST_FABRIC_LAKEFORMATION_INSTANCE_ID, #LakeFormation服务的实例ID obs_directory_base=OBS_DIRECTORY_BASE, # obs中udf的存储路径 obs_bucket_name=OBS_BUCKET_NAME, # obs的桶名字 obs_server=OBS_SERVER, # obs访问地址,参见终端节点(Endpoint)和访问域名 ) t = con.table("table_name", database="db") # 通过连接到后端获取table表信息,建立表对象 t.select("cola") # 查询表字段 df = t.execute() # 将DataFrame转为SQL,传输到后端执行,并且返回Pandas DataFrame格式的结果