更新时间:2023-05-05 GMT+08:00
分享

修改列数据类型

概述

修改数据集相应列的数据类型。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象

输出

数据集

参数说明

参数

子参数

参数说明

column_type_map_str

-

指定相应列的数据类型的规范化字符串,例如:"column_a:string,column_b:integer",列类型可以是:string,integer,long,float,double,bool,date,timestamp

timestamp_format

-

取值yyyy-MM-dd HH:mm:ss

date_format

-

取值yyyy-MM-dd

样例

inputs = {
    "dataframe": None  # @input {"label":"dataframe","type":"DataFrame"}
}
params = {
    "inputs": inputs,
    "column_type_map_str": "",  # @param {"label":"column_type_map_str","type":"string","required":"true","helpTip":""}
    "timestamp_format": "yyyy-MM-dd HH:mm:ss",  # @param {"label":"timestamp_format","type":"string","required":"false","helpTip":""}
    "date_format": "yyyy-MM-dd"  # @param {"label":"date_format","type":"string","required":"false","helpTip":""}
}
modify_data_type____id___ = MLSModifyDataType(**params)
modify_data_type____id___.run()
# @output {"label":"dataframe","name":"modify_data_type____id___.get_outputs()['output_port_1']","type":"DataFrame"}

相关文档