更新时间:2024-12-30 GMT+08:00
训练迁移适配
完成环境准备之后,本节将详细介绍Dit模型训练迁移过程。
- 执行以下命令,下载代码。
git clone https://github.com/facebookresearch/DiT.git cd Dit
- 执行以下命令,安装依赖项。
pip install diffusers==0.28.0 accelerate==0.30.1 timm==0.9.16
- 准备数据集。
下载Kaggle官网提供的imagenet-mini数据集,解压之后文件大小4.1GB。该数据集是从[imagenet-2012]数据集中筛选的少量数据集。
- 准备预训练权重。
下载Hugging Face权重。
- 迁移适配。
- 入口函数train.py导入自动迁移接口。
import torch_npu from torch_npu.contrib import transfer_to_npu
- 将预训练模型指定为实际下载路径。
- 开始训练。
torchrun --nnodes=1 --nproc_per_node=1 train.py --model DiT-XL/2 --data-path imagenet/train --global-batch-size 16
多卡训练启动方式:
torchrun --nnodes=1 --nproc_per_node=8 train.py --model DiT-XL/2 --data-path imagenet/train --global-batch-size 128
正常训练回显日志:
- 入口函数train.py导入自动迁移接口。