文档首页/ AI开发平台ModelArts/ 故障排除/ 轻量算力节点/ NpuRoceIPAddressMismatch事件处理建议
更新时间:2026-02-06 GMT+08:00
分享

NpuRoceIPAddressMismatch事件处理建议

故障影响

机器参数面网络异常,多机任务无法执行。

告警解释

RoCE网卡的实际IP地址与配置文件hccn.conf中的IP地址不一致。

告警参数

参数名称

参数含义

名称

NPU:RoCE IP地址不匹配

类型

故障类告警

发生时间

告警触发时间

定位信息

局点、云服务、微服务、虚拟机ID、虚拟机名称、告警信息

可能原因

配置的IP地址未生效。

处理步骤

1. 清空 /etc/hccn.conf 文件内容,然后重启服务器。

2. 若重启后问题仍未解决,建议提工单,联系运维人员协助处理。

告警清除

此告警恢复后,关闭工单时清除方式选择清除网管告警即可。

参考信息

相关文档