更新时间:2024-10-16 GMT+08:00
分享

查看提示词评估结果

  1. 评估任务创建完成后,会跳转至“评估”页面,在该页面可以查看评估状态。
    图1 查看评估状态
  2. 单击评估名称,进入评估任务详情页,可以查看详细的评估进度。例如,在图2中有10条评估用例,当前已经评估了8条,剩余2条待评估。
    图2 查看评估进展
  3. 评估完成后,进入“评估报告”页面,可以查看每条数据的评估结果。

    在评估结果中,“预期结果”即为变量值(问题)所预设的期望回答,“生成结果”即模型回复的结果。通过比较“预期结果”与“生成结果”的差异可以判断提示词效果。

    图3 查看评估报告

相关文档