更新时间:2026-06-29 GMT+08:00
分享

查看模型评测任务详情

在“模型评测”页面的评测任务列表,找到目标评测任务,单击任务名称,进入评测任务详情界面,可以查看该任务基础信息、评测指标、视频回放。

图1 评测任务详情示例

筛选评测任务

当前评测任务如果有多次运行记录,可以选择运行记录的流水号查看某次运行记录的任务详情。

图2 选择运行记录流水号示例

基础信息

图3 基础信息示例
表1 基础信息的公共部分

参数

说明

任务ID

本次评测任务的任务ID。

单击,即可复制该任务ID。

模型

本次评测任务选择模型信息,包括模型名称、版本。

模型服务

本次评测任务选择已部署模型服务。

模型服务ID

本次评测任务选择已部署模型服务ID。

单击,即可复制该模型服务ID。

资源池

本次评测任务的资源池,支持“公共资源池”和“专属资源池”。

评测类型

本次任务选择评测类型,分为“单任务”、“任务集”。

评测结果保存路径

本次任务的评测结果(保存的视频、日志文件等)保存路径。

单击,即可复制该保存路径,并可以在OBS工具查看保存的文件。

创建时间

本次任务的创建时间。

描述

本次任务的描述信息,通过此描述可以清晰了解任务目的、场景等信息。

表2 评测任务基础信息(单任务)

参数

说明

评测类型

本次任务选择“单任务”。

任务场景资产

本次任务选择的评测仿真资产,即仿真场景。

评测次数

本次任务的模型评测次数。

超时时长(秒)

本次任务可以超出的时长。

回放视频保存设置

本次任务是否已配置回放视频保存设置。

如果已配置,鼠标移至该参数处会显示设置名称。

图4 回放视频保存设置示例

成功采样比例

本次任务回放视频保存设置选择“执行成功-标准耗时”时设置的成功采样比例。

表3 评测任务基础信息(任务集)

参数

说明

评测类型

本次任务选择“任务集”。

任务类型

本次任务的任务类型,目前仅支持Libero。

任务套件

本次任务选择Libero任务套件。

参数配置

本次任务的配置参数。

如果已配置,鼠标移至该参数处会显示参数配置详情。

图5 参数配置示例

评测指标

图6 单任务评测指标示例

按照图标展示评测执行成功率、评测执行时间。

表4 单任务评测指标

参数

说明

评测执行成功率

本次任务的模型评测成功率(成功次数/总次数)。

评测执行时间

本次任务的评测时间(秒),主要分为执行成功最大时间、执行成功最小时间、执行成功平均时间、总执行时间。

图7 任务集评测指标示例
表5 任务集评测指标

参数

说明

总体成功率

本次任务的总体成功率(成功次数/任务总次数)。

分套件成功率

本次任务分套件的成功率(成功次数/总次数)。

任务指标

按照列表展示分套件的子任务评测回合、成功率等信息。

视频回放

图8 视频回放示例

在视频回放区域会显示与评测次数一致的回放视频,并显示本次测评成功/失败,还可以在线播放/下载视频。

相关文档