更新时间:2023-05-05 GMT+08:00
分享

二分类评估

概述

对二分类模型预测的结果数据集进行评估。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象

输出

二分类的评估指标:pr面积、roc面积、准确率、精确率、召回率、F1、混淆矩阵等

参数说明

参数

子参数

参数说明

label_col

-

目标列

probability_col

-

输入预测数据集的概率列的列名

prediction_index_col

-

输入预测数据集的预测label 标签列的列名

label_index_col

-

输入预测数据集的真实label标签列的列名

样例

inputs = {
    "predict_dataframe": None  # @input {"label":"dataframe","type":"DataFrame"}
}
params = {
    "inputs": inputs,
    "label_col": "",  # @param {"label": "label_col", "type": "string", "required": "true", "helpTip": ""}
    "probability_col": "probability",  # @param {"label": "probability_col", "type": "string", "required": "true", "helpTip": ""}
    "prediction_index_col": "prediction_index",  # @param {"label": "prediction_index_col", "type": "string", "required": "true", "helpTip": ""}
    "label_index_col": "label_index"  # @param {"label": "label_index_col", "type": "string", "required": "true", "helpTip": ""}
}
binary_class_evaluation____id___ = MLSBinaryClassEvaluation(**params)
binary_class_evaluation____id___.run()
# @output {"label":"dataframe","name":"binary_class_evaluation____id___.get_outputs()['output_port_1']","type":"DataFrame"}

分享:

    相关文档

    相关产品