创建多模态大模型评测数据集
多模态大模型支持人工评测和基于大模型的评测,人工评测方式需要通过人工创建的评测数据集和评测指标项对模型生成的回答进行评测,评测时需要人工基于创建好的评测项对模型回答进行打分,评测完成后会基于打分结果生成评测报告。
创建多模态大模型的评测任务,需要用户在自己的obs桶中准备好数据。数据格式为图片存放目录+jsonl文件,目录结构如下:
其中jsonl文件内容格式为图片+QA对格式:

检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
多模态大模型支持人工评测和基于大模型的评测,人工评测方式需要通过人工创建的评测数据集和评测指标项对模型生成的回答进行评测,评测时需要人工基于创建好的评测项对模型回答进行打分,评测完成后会基于打分结果生成评测报告。
创建多模态大模型的评测任务,需要用户在自己的obs桶中准备好数据。数据格式为图片存放目录+jsonl文件,目录结构如下:
其中jsonl文件内容格式为图片+QA对格式:
