更新时间:2024-10-16 GMT+08:00
分享

Notebook自定义镜像故障基础排查

当制作的自定义镜像使用出现故障时,请用户按照如下方法排查:

  • 用户自定义镜像没有ma-user用户及ma-group用户组;
  • 用户自定义镜像中/home/ma-user目录,属主和用户组不是ma-user和ma-group;
  • 用户自定义镜像必须满足用户目录/home/ma-user权限为750,不能为其他权限;
  • 用户自定义镜像使用远程SSH功能,OpenSSH版本要兼容或高于8.0;
  • 用户制作的自定义镜像,在本地执行docker run启动,无法正常运行;
  • 用户自行安装了Jupyterlab服务导致冲突的,需要用户本地使用Jupyterlab命令罗列出相关的静态文件路径,删除并且卸载镜像中的Jupyterlab服务;
  • 用户自己业务占用了开发环境官方的8888、8889端口的,需要用户修改自己的进程端口号;
  • 用户的镜像指定了PYTHONPATH、sys.path导致服务启动调用冲突的,需在实例启动后,再指定PYTHONPATH、sys.path;
  • 用户使用了已开启sudo权限的专属池,使用自定义镜像时,sudo工具未安装或安装错误;
  • 用户使用的cann、cuda环境有兼容性问题;
  • 用户的docker镜像配置错误、网络或防火墙限制、镜像构建问题(文件权限、依赖缺失或构建命令错误)等原因导致的。

相关文档