文档首页/
AI开发平台ModelArts/
最佳实践/
LLM大语言模型训练推理/
Qwen系列模型基于DevServer适配PyTorch NPU训练指导(6.3.904)/
常见问题/
训练时报“EI0006: Getting socket times out”
更新时间:2024-04-28 GMT+08:00
训练时报“EI0006: Getting socket times out”
该报错为HCCL通讯时间超时,默认时间为120s;因此需在启动训练任务前执行,在容器内设置HCCL通讯超时时间。
export HCCL_CONNECT_TIMEOUT=7200
父主题: 常见问题