更新时间:2024-04-28 GMT+08:00
分享

训练时报“EI0006: Getting socket times out”

该报错为HCCL通讯时间超时,默认时间为120s;因此需在启动训练任务前执行,在容器内设置HCCL通讯超时时间。

export HCCL_CONNECT_TIMEOUT=7200 

分享:

    相关文档

    相关产品