DataFrame create_table函数使用说明
create_table用于在DataArtsFabric创建一个表,函数签名如下:
def create_table(
self,
name: str,
obj: Optional[Union[ir.Table, pd.DataFrame, pa.Table, pl.DataFrame, pl.LazyFrame]] = None,
*,
schema: Optional[ibis.Schema] = None,
database: Optional[str] = None,
temp: bool = False,
external: bool = False,
overwrite: bool = False,
partition_by: Optional[ibis.Schema] = None,
table_properties: Optional[dict] = None,
store: Optional[str] = None,
location: Optional[str] = None
)
|
参数名称 |
类型 |
是否必须 |
说明 |
|---|---|---|---|
|
name |
str |
是 |
要创建的表名。 |
|
obj |
ir.Table|pd.DataFrame|pa.Table|pl.DataFrame|pl.LazyFrame |
否 |
用于填充表格的数据;必须至少指定obj或schema之一(当前不支持在创建表的时候插入数据)。 |
|
schema |
sch.SchemaLike |
否 |
要创建的表的架构;必须至少指定obj或schema之一。 |
|
database |
str |
否 |
创建表的数据库的名称;如果未传递,则使用当前数据库。 |
|
temp |
bool |
否 |
是否创建为临时表。默认为False。 |
|
external |
bool |
否 |
是否创建为外表。默认为False。 |
|
overwrite |
bool |
否 |
如果为True,表已存在则替换表。默认为False(当前不支持覆盖表)。 |
|
partition_by |
sch.SchemaLike |
否 |
指定分区列,分区列中出现的列不能出现在表的普通列描述中。 |
|
table_properties |
dict |
否 |
表级别可选参数设置,支持参数范围如下参考表1。 |
|
store |
str |
否 |
表存储格式,支持ORC、PARQUET、HUDI、ICEBERG四种存储格式。 |
|
location |
str |
否 |
表存储路径,必须为合法OBS路径,支持OBS对象桶和并行文件系统。
|