更新时间:2024-09-14 GMT+08:00
分享

录制Profiling

Ascend PyTorch Profiler是针对PyTorch框架开发的性能数据采集和解析工具,通过在PyTorch训练脚本中插入Ascend PyTorch Profiler接口,执行训练的同时采集性能数据,完成训练后直接输出可视化的性能数据文件,提升了性能分析效率。

Ascend PyTorch Profiler接口可全面采集PyTorch训练场景下的性能数据,主要包括PyTorch层算子信息、CANN层算子信息、底层NPU算子信息、以及算子内存占用信息等,可以全方位分析PyTorch训练时的性能状态。

录制命令如下:

在启动训练脚本基础上Step3 启动训练脚本 新加DO_PROFILER=1和PROF_SAVE_PATH=/save_path参数,单机启动举例说明:

DO_PROFILER=1 PROF_SAVE_PATH=/save_path sh demo.sh localhost 1 0
  • PROF_SAVE_PATH:Profiling录制结果存放路径
  • DO_PROFILER:是否开启Profiling录制功能

相关文档