文档首页> AI开发平台ModelArts> 故障排除> 训练作业> 云上迁移适配故障> Pytorch1.0引擎提示“RuntimeError: std::exception”
更新时间:2022-12-08 GMT+08:00

Pytorch1.0引擎提示“RuntimeError: std::exception”

问题现象

在使用pytorch1.0镜像时,必现如下报错:
“RuntimeError: std::exception”

原因分析

出现该问题的可能原因如下:

pytorch1.0镜像中的libmkldnn软连接与原生torch的冲突,具体可参看文档

处理方法

  1. 按照issues中的说明,应该是环境中的库冲突了,因此在启动脚本最开始之前,添加如下代码。
    import os
    os.system("rm /home/work/anaconda3/lib/libmkldnn.so")
    os.system("rm /home/work/anaconda3/lib/libmkldnn.so.0")
  2. 必现的问题,使用本地Pycharm远程连接Notebook调试。

建议与总结

在创建训练作业前,推荐您先使用ModelArts开发环境调试训练代码,避免代码迁移过程中的错误。