MindSpeed-MM
本章节主要描述训练所需的yaml配置文件、配置参数说明,用户可根据实际自行选择其需要的参数。
yaml文件参数配置
根据以下示例步骤修改yaml文件。
- 数据集及模型路径设置:
参数
示例值
参数说明
backend_config.data.dataset_param.preprocess_parameters.model_name_or_path
/home/ma-user/AscendFactory/ckpts/hf_path/Qwen2.5-VL-7B-Instruct
【必修改】转换前的权重路径。请根据实际规划修改。
backend_config.data.dataset_param.basic_parameters.dataset_dir
/home/ma-user/AscendFactory/data
【必修改】数据集路径。请根据实际规划修改。
- 权重转换设置,详解如下。
参数
示例值
参数说明
backend_config.convert_ckpt_hf2mg.cfg.mm_dir
/home/ma-user/AscendFactory/ckpts/mm_path/converted_weight_TP${backend_config.training.tensor-model-parallel-size}_PP${backend_config.training.pipeline-model-parallel-size}
【必修改】转换后保存目录。请根据实际规划修改。
backend_config.convert_ckpt_hf2mg.cfg.hf_config.hf_dir
${backend_config.data.dataset_param.preprocess_parameters.model_name_or_path}
huggingface权重目录。
backend_config.convert_ckpt_hf2mg.cfg.parallel_config.llm_pp_layers
- 1
- 10
- 10
- 7
llm在每个卡上切分的层数,注意要和微调时backend_config.model中配置的pipeline_num_layers一致。
backend_config.convert_ckpt_hf2mg.cfg.parallel_config.vit_pp_layers
- 32
- 0
- 0
- 0
vit在每个卡上切分的层数,注意要和微调时backend_config.model中配置的pipeline_num_layers一致。
backend_config.convert_ckpt_mg2hf.cfg.parallel_config.tp_size
1
tp并行数量,注意要和training中的配置一致。
backend_config.convert_ckpt_mg2hf.cfg.save_hf_dir
${af_output_dir}/ckpt_converted_mg2hf
mm微调后转换回hf模型格式的目录。
backend_config.convert_ckpt_mg2hf.cfg.parallel_config.llm_pp_layers
- 1
- 10
- 10
- 7
llm在每个卡上切分的层数,注意要和微调时backend_config.model中配置的pipeline_num_layers一致。
backend_config.convert_ckpt_mg2hf.cfg.parallel_config.vit_pp_layers
- 32
- 0
- 0
- 0
vit在每个卡上切分的层数,注意要和微调时backend_config.model中配置的pipeline_num_layers一致。
backend_config.convert_ckpt_mg2hf.cfg.parallel_config.tp_size
1
tp并行数量,注意要和training中的配置一致。
- 模型保存加载及日志信息配置,详解如下。
参数
示例值
参数说明
backend_config.training.load
${..convert_ckpt_hf2mg.cfg.mm_dir}
模型加载路径。请根据实际规划修改。
backend_config.training.save
${af_output_dir}/saved_checkpoints
模型保存路径。请根据实际规划修改。
backend_config.training.no-load-optim
true
是否加载优化器状态。若需加载请置为false。
backend_config.training.no-load-rng
true
是否加载随机数状态。若需加载请置为false。
backend_config.training.no-save-optim
true
是否保存优化器状态。若需加载请置为false。
backend_config.training.no-save-rng
true
是否保存随机数状态。若需加载请置为false。
backend_config.training.log-interval
1
日志间隔。
backend_config.training.save-interval
5000
保存间隔。
其余未提及参数参考三方官方特性文档修改配置。