SFT全参微调训练
前提条件
已上传训练代码、训练权重文件和数据集到OBS中,具体参考代码上传至OBS。
Step1 创建训练任务
创建训练作业,并自定义名称、描述等信息。选择自定义算法,启动方式自定义,以及选择上传的镜像。

训练作业启动命令中输入:
cd /home/ma-user/work/Qwen-VL; ln -s ${DATA}/ qwenvl_dataset; bash finetune/finetune_ds.sh;
Step2 配置数据输入和输出
单击“增加训练输入”和“增加训练输出”,用于配置训练作业开始时需要输入数据的路径和训练结束后输出数据的路径。
- 在“输入”的输入框内设置变量:DATA、MODEL。
- DATA:训练数据集的路径/standard-qwenvl-7b/training_data/qwenvl_dataset/。
- MODEL:模型权重的路径/standard-qwenvl-7b/models/Qwen-VL-Chat/。
- 在“输出”的输入框内设置变量:OUTPUT。
OUTPUT:训练完成后指定的输出模型的路径/standard-qwenvl-7b/output/。在OBS桶中新建一个output目录,用于训练的输出路径。
- 分别单击“输入”和“输出”的数据存储位置,如图所示,选择OBS桶中指定的目录。
- “输入”和“输出”中的获取方式全部选择为:环境变量。
- “输出”中的预下载至本地目标选择:下载,此时输出路径中的数据则会下载至OBS中。

Step4 开启训练故障自动重启功能
创建训练作业时,可开启自动重启功能。当环境问题导致训练作业异常时,系统将自动修复异常或隔离节点,并重启训练作业,提高训练成功率。
