更新时间:2025-09-08 GMT+08:00
分享

MindSpeed-MM

本章节主要描述训练所需的yaml配置文件、配置参数说明,用户可根据实际自行选择其需要的参数。

yaml文件参数配置

根据以下示例步骤修改yaml文件。

  1. 数据集及模型路径设置:

    参数

    示例值

    参数说明

    backend_config.data.dataset_param.preprocess_parameters.model_name_or_path

    /home/ma-user/AscendFactory/ckpts/hf_path/Qwen2.5-VL-7B-Instruct

    【必修改】转换前的权重路径。请根据实际规划修改。

    backend_config.data.dataset_param.basic_parameters.dataset_dir

    /home/ma-user/AscendFactory/data

    【必修改】数据集路径。请根据实际规划修改。

  2. 权重转换设置,详解如下。

    参数

    示例值

    参数说明

    backend_config.convert_ckpt_hf2mg.cfg.mm_dir

    /home/ma-user/AscendFactory/ckpts/mm_path/converted_weight_TP${backend_config.training.tensor-model-parallel-size}_PP${backend_config.training.pipeline-model-parallel-size}

    【必修改】转换后保存目录。请根据实际规划修改。

    backend_config.convert_ckpt_hf2mg.cfg.hf_config.hf_dir

    ${backend_config.data.dataset_param.preprocess_parameters.model_name_or_path}

    huggingface权重目录。

    backend_config.convert_ckpt_hf2mg.cfg.parallel_config.llm_pp_layers

    - 1

    - 10

    - 10

    - 7

    llm在每个卡上切分的层数,注意要和微调时backend_config.model中配置的pipeline_num_layers一致。

    backend_config.convert_ckpt_hf2mg.cfg.parallel_config.vit_pp_layers

    - 32

    - 0

    - 0

    - 0

    vit在每个卡上切分的层数,注意要和微调时backend_config.model中配置的pipeline_num_layers一致。

    backend_config.convert_ckpt_mg2hf.cfg.parallel_config.tp_size

    1

    tp并行数量,注意要和training中的配置一致。

    backend_config.convert_ckpt_mg2hf.cfg.save_hf_dir

    ${af_output_dir}/ckpt_converted_mg2hf

    mm微调后转换回hf模型格式的目录。

    backend_config.convert_ckpt_mg2hf.cfg.parallel_config.llm_pp_layers

    - 1

    - 10

    - 10

    - 7

    llm在每个卡上切分的层数,注意要和微调时backend_config.model中配置的pipeline_num_layers一致。

    backend_config.convert_ckpt_mg2hf.cfg.parallel_config.vit_pp_layers

    - 32

    - 0

    - 0

    - 0

    vit在每个卡上切分的层数,注意要和微调时backend_config.model中配置的pipeline_num_layers一致。

    backend_config.convert_ckpt_mg2hf.cfg.parallel_config.tp_size

    1

    tp并行数量,注意要和training中的配置一致。

  3. 模型保存加载及日志信息配置,详解如下。

    参数

    示例值

    参数说明

    backend_config.training.load

    ${..convert_ckpt_hf2mg.cfg.mm_dir}

    模型加载路径。请根据实际规划修改。

    backend_config.training.save

    ${af_output_dir}/saved_checkpoints

    模型保存路径。请根据实际规划修改。

    backend_config.training.no-load-optim

    true

    是否加载优化器状态。若需加载请置为false。

    backend_config.training.no-load-rng

    true

    是否加载随机数状态。若需加载请置为false。

    backend_config.training.no-save-optim

    true

    是否保存优化器状态。若需加载请置为false。

    backend_config.training.no-save-rng

    true

    是否保存随机数状态。若需加载请置为false。

    backend_config.training.log-interval

    1

    日志间隔。

    backend_config.training.save-interval

    5000

    保存间隔。

    其余未提及参数参考三方官方特性文档修改配置。

相关文档