录制Profiling
Ascend PyTorch Profiler是针对PyTorch框架开发的性能数据采集和解析工具,通过在PyTorch训练脚本中插入Ascend PyTorch Profiler接口,执行训练的同时采集性能数据,完成训练后直接输出可视化的性能数据文件,提升了性能分析效率。
Ascend PyTorch Profiler接口可全面采集PyTorch训练场景下的性能数据,主要包括PyTorch层算子信息、CANN层算子信息、底层NPU算子信息、以及算子内存占用信息等,可以全方位分析PyTorch训练时的性能状态。
录制命令如下:
在启动训练脚本基础:步骤三:启动训练脚本 新加DO_PROFILER=1和PROF_SAVE_PATH=/save_path参数,单机启动举例说明:
DO_PROFILER=1 PROF_SAVE_PATH=/save_path sh demo.sh localhost 1 0
- PROF_SAVE_PATH:Profiling录制结果存放路径
- DO_PROFILER:是否开启Profiling录制功能