更新时间:2024-12-30 GMT+08:00
分享

使用Advisor工具分析生成调优建议

关于Advisor使用及安装过程请参见昇腾社区Gitee。最后生成导出的各类场景的建议包含以下两种:

  1. Terminal日志信息的概览建议。

  2. 包含Detail信息及修改示例的HTML信息。

按照建议信息做如下修改:

亲和优化器使能,在train.py中修改优化器为apex混合精度模式下的DDP优化方式(修改点:注释第161和167行,增加第168~170行)。

二进制调优使能,减少算子编译耗时,在train.py头文件导入之后添加 (修改点:增加第37行)。

torch_npu.npu.set_compile_mode(jit_compile=False)

AICPU算子调优 ,Double类型输入切换成为Float减少cast算子调用耗时,修改diffusion/gaussian_diffusion.py (修改点:注释第871行,增加第872行)。

相关文档