评估模型
训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。一次性很难获得一个满意的模型,需要反复的调整算法参数、数据,不断评估训练生成的模型。
一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。
前提条件
已在自然语言处理套件控制台选择“通用实体抽取工作流”新建应用,并训练模型,详情请见训练模型。
整体评估
在“模型评估”页面,您可以针对当前版本的模型进行整体评估。
“整体评估”左侧显示当前模型的标签名称和评估参数值,包括“精准率”、“召回率”、“F1值”。
“整体评估”右侧显示当前模型和其他版本模型的评估参数值柱状图,包括“精准率”、“召回率”、“F1值”。您可以在上方单击选择“对比版本”。
您可以在左侧选择不同的标签,右侧会显示对应标签样本的评估参数值柱状图。
详细评估
在“模型评估”页面,您可以查看测试集中数据模型预测结果。
“详细评估”左侧选择文本,右侧显示模型预测的实体抽取结果和正确的抽取结果,您可以判断当前模型抽取的实体是否正确。