更新时间:2025-07-29 GMT+08:00
分享

工具介绍及准备工作

本章节主要介绍针对LLaMAFactory开发的测试工具benchmark,支持训练、性能对比、下游任务评测、loss和下游任务对比能力。对比结果以excel文件呈现。方便用户验证发布模型的质量。所有配置都通过yaml文件设置,用户查看默认yaml文件即可知道最优性能的配置。

目前仅支持SFT指令监督微调训练阶段。

准备工作

参考benchmark-准备工作,开始训练测试,具体步骤参考训练性能测试训练精度测试,根据实际情况决定。

相关文档