DataFrame create_table函数使用说明
create_table用于在DataArtsFabric创建一个表,函数签名如下:
def create_table( self, name: str, obj: Optional[Union[ir.Table, pd.DataFrame, pa.Table, pl.DataFrame, pl.LazyFrame]] = None, *, schema: Optional[ibis.Schema] = None, database: Optional[str] = None, temp: bool = False, external: bool = False, overwrite: bool = False, partition_by: Optional[ibis.Schema] = None, table_properties: Optional[dict] = None, store: Optional[str] = None, location: Optional[str] = None )
参数名称 |
类型 |
是否必须 |
说明 |
---|---|---|---|
name |
str |
是 |
要创建的表名。 |
obj |
ir.Table|pd.DataFrame|pa.Table|pl.DataFrame|pl.LazyFrame |
否 |
用于填充表格的数据;必须至少指定obj或schema之一(当前不支持在创建表的时候插入数据)。 |
schema |
sch.SchemaLike |
否 |
要创建的表的架构;必须至少指定obj或schema之一。 |
database |
str |
否 |
创建表的数据库的名称;如果未传递,则使用当前数据库。 |
temp |
bool |
否 |
是否创建为临时表。默认为False。 |
external |
bool |
否 |
是否创建为外表。默认为False。 |
overwrite |
bool |
否 |
如果为True,表已存在则替换表。默认为False(当前不支持覆盖表)。 |
partition_by |
sch.SchemaLike |
否 |
指定分区列,分区列中出现的列不能出现在表的普通列描述中。 |
table_properties |
dict |
否 |
表级别可选参数设置,支持参数范围如下参考表1。 |
store |
str |
否 |
表存储格式,支持ORC、PARQUET、HUDI、ICEBERG四种存储格式。 |
location |
str |
否 |
表存储路径,必须为合法OBS路径,支持OBS对象桶和并行文件系统。
|