更新时间:2024-12-30 GMT+08:00
分享

训练迁移适配

完成环境准备之后,本节将详细介绍Dit模型训练迁移过程。

  1. 执行以下命令,下载代码。

    git clone https://github.com/facebookresearch/DiT.git
    cd Dit

  2. 执行以下命令,安装依赖项。

    pip install diffusers==0.28.0 accelerate==0.30.1 timm==0.9.16

  3. 准备数据集。

    下载Kaggle官网提供的imagenet-mini数据集,解压之后文件大小4.1GB。该数据集是从[imagenet-2012]数据集中筛选的少量数据集。

  4. 准备预训练权重。

    下载Hugging Face权重。

  5. 迁移适配。

    1. 入口函数train.py导入自动迁移接口。

      执行以下命令,导入自动迁移接口。

      import torch_npu
      from torch_npu.contrib import transfer_to_npu

    2. 将预训练模型指定为实际下载路径。
    3. 开始训练。

      单卡训练启动方式:

      torchrun --nnodes=1 --nproc_per_node=1 train.py --model DiT-XL/2 --data-path imagenet/train --global-batch-size 16

      多卡训练启动方式:

      torchrun --nnodes=1 --nproc_per_node=8 train.py --model DiT-XL/2 --data-path imagenet/train --global-batch-size 128

      正常训练回显日志:

相关文档