更新时间:2025-07-08 GMT+08:00
分享

DataArtsFabric DataFrame概述

场景介绍

本章节提供了类Pandas的Python DataFrame SDK,方便用户使用Python编写数据处理作业;同时利用DataArtsFabric SQL内核高效的计算能力,为数据科学家、AI工程师等提供了易用、高效的数据处理能力。

本特性基于Ibis Python DataFrame开源框架实现,将Ibis前端框架与DataArtsFabric SQL引擎对接。用户可基于熟悉的Ibis DataFrame API编写数据处理脚本,Ibis框架将Python API翻译为DataArtsFabric SQL引擎可执行的SQL语句并下发,从而实现计算逻辑在DataArtsFabric SQL引擎的高效处理。

什么是DataFrame

DataFrame是一种二维表格型的数据结构,类似于Excel表或关系型数据库中的表,支持行和列标签。

它的核心特点包括:

  • 行列结构:数据以行和列的形式组织,每列可以有不同的数据类型,例如整数、字符串、浮点数等。
  • 标签支持:行和列通常有标签(索引),方便将数据进行筛选、操作和分析。
  • 功能丰富:支持数据清洗、转换、聚合、合并等操作,是数据分析和科学计算的常用工具。

相关文档