文档首页/
AI开发平台ModelArts/
最佳实践/
LLM大语言模型训练推理/
主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导(6.3.910)/
训练benchmark工具/
训练精度测试
更新时间:2024-11-21 GMT+08:00
训练精度测试
流程图
训练精度测试流程图如下图所示:
图1 训练精度测试流程图
执行训练任务
- 进入test-benchmark目录执行训练命令,可以多次执行,按自己实际情况。
benchmark-cli train <cfgs_yaml_file> <model_name> <run_type>
- <cfgs_yaml_file>:精度测试配置的yaml文件地址,指代码目录中accuracy_cfgs.yaml相对或绝对路径
- <model_name>:训练模型名,如qwen2.5-7b
- <run_type>:训练策略类型及数据序列长度:【lora:4096-lora、full:4096-full】
- 训练完成后,test-benchmark目录下会生成训练日志及NPU利用率日志及权重文件,如qwen2.5-7b日志:
- qwen2.5-7b-sft-4096-lora-313T-20241028_164746-0.txt
- qwen2.5-7b-sft-4096-lora-313T-20241028_164746-npu_info-0.txt
执行精度比较脚本
进入test-benchmark目录执行命令:
benchmark-cli accuracy <cfgs_yaml_file> --o <output_dir> --baseline <baseline>
查看精度结果
任务完成之后会在test-benchmark目录下生成excel表格:
精度结果 LLaMAFactory_train_accuracy_benchmark_<版本号>_<时间戳>.xlsx
样例截图:
父主题: 训练benchmark工具