更新时间:2024-12-02 GMT+08:00
分享

查看提示词评估结果

  1. 评估任务创建完成后,会跳转至“评估”页面,在该页面可以查看评估状态。
    图1 查看提示词评任务状态
  2. 单击“评估名称”,进入评估任务详情页,可以查看详细的评估进度,例如在图2中有10条评估用例,当前已评估8条,剩余2条待评估。
    图2 查看评估进展
  3. 评估完成后,可以查看每条数据的评估结果。

    在评估结果中,“预期结果”表示变量值(问题)所预设的期望回答,“生成结果”表示模型回复的结果。通过比对“预期结果”、“生成结果”的差异可以判断提示词效果。

相关文档