更新时间:2024-12-18 GMT+08:00
直接挂载OBS目录进行大规模计算,如何解决偶现报错
问题现象
运行作业时,作业直接挂载OBS目录进行大规模计算。偶现“异常应用”,并日志报错input/output error或file xxx not exists。
问题原因
- OBS集群到计算集群之间的带宽达到了上限。
- OBS集群的IOPS达到了上限。
父主题: 流程、作业