更新时间:2026-06-29 GMT+08:00
分享

管理模型评测任务

查询模型评测任务

模型评测页面按照列表展示所有创建的评测任务,可以按照需要筛选模型评测任务。

  • 查看全部评测任务
    图1 查看全部评测任务

    单击“全部”,即可查看当前工作空间下的所有评测任务。

  • 筛选评测任务
    图2 筛选评测任务
    • 在页面上方,单击“等待配置”、“执行中”或“失败”,可以筛选对应的评测任务。
    • 在搜索框默认按照任务名称搜索评测任务,还可以按照状态、评测任务(单任务/任务集)进行筛选。

终止评测任务

仅支持终止处于“资源准备中”、“等待配置”、“执行中”的评测任务。

  1. 在左侧菜单栏选择“模型开发 > 模型评测”,进入“模型评测”页面。
  2. 在模型评测列表找到目标评测任务,单击对应“操作”列的“终止”。
  3. 在“终止评测任务”界面,确认后单击“确定”。

重新评测任务

如果对模型评测任务不满意,可以重新评测,调整评测任务的评测模型、评测场景等。

  1. 在左侧菜单栏选择“模型开发 > 模型评测”,进入“模型评测”页面。
  2. 在模型评测列表找到目标评测任务,单击对应“操作”列的“重新评测”。
  3. 在“重新评测任务”页面,按照页面提示配置模型评测参数,完成单击“确认”。

查看评测任务运行记录

在评测任务列表找到目标评测任务,单击对应的“运行记录”,在“运行记录”界面显示该评测任务的运行记录。

图3 查看运行记录

评测任务其他操作

复制任务名称/ID

在评测任务列表找到目标任务,鼠标移至“任务名称/ID”处,单击,即可复制任务名称或ID。

相关文档