使用Advisor工具分析生成调优建议
关于Advisor使用及安装过程请参见昇腾社区Gitee。最后生成导出的各类场景的建议包含以下两种:
按照建议信息做如下修改:
亲和优化器使能,在train.py中修改优化器为apex混合精度模式下的DDP优化方式(修改点:注释第161和167行,增加第168~170行)。
二进制调优使能,减少算子编译耗时,在train.py头文件导入之后添加 (修改点:增加第37行)。
torch_npu.npu.set_compile_mode(jit_compile=False)
AICPU算子调优 ,Double类型输入切换成为Float减少cast算子调用耗时,修改diffusion/gaussian_diffusion.py (修改点:注释第871行,增加第872行)。