文档首页/ AI开发平台ModelArts/ 最佳实践/ LLM大语言模型训练/ LLM大语言模型训练其它版本/ 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.905）/ 训练服务评测

更新时间：2025-12-15 GMT+08:00

查看PDF

训练服务评测

介绍如何使用benchmark工具对训练性能（吞吐）、精度（loss、下游打分）开展评测对比，对比结果以excel文件呈现，方便用户验证发布模型的质量。评测包括以下两部分：

性能评测
精度评测

约束限制

训练服务评测目前仅适配了Lite Server环境部署的微调（SFT）训练阶段。

性能评测

流程图：

图1 训练性能测试流程

详细步骤：

已完成ModelArts Lite Server环境训练任务。
3.1 训练任务中同级目录执行性能比较脚本，如test-benchmark目录。
```
ascendfactory-cli performance --result_dir=<result_dir> --backend=<backend> --baseline=<baseline> --output_dir=<output_dir>
```
- <result_dir>：所有的训练任务的输出父级目录。
- <backend>：所选框架类型，可选【mindspeed-llm，llamafactory】。
- <baseline>：<可选>GP-Ant8机器性能基线yaml文件路径，用户可自行修改，不填则使用自带基线配置config目录下xxx_performance_baseline.yaml，基线样例配置如下：
- <output_dir>： <可选>任务完成输出excel表格路径，默认为"./"当前所在路径。
查看性能结果excel表格：${model_name}_train_performance_benchmark_<版本号>_<时间戳>.xlsx，${model_name}为所选框架名称。
Llama-Factory表格样例如下：

MindSpeed-LLM表格样例如下：

精度评测

当前版本暂不支持。

父主题： 主流开源大模型基于ModelArts Standard&Lite Server适配AscendFactory PyTorch NPU训练指导（6.5.905）

上一篇：训练结果输出

下一篇：训练服务配置说明

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问