下发应用到边缘节点失败
问题描述
应用无法下发到边缘节点。
排查思路
以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因。
可能原因 |
处理措施 |
---|---|
边缘节点故障 |
登录IEF管理控制台,选择“边缘资源 > 边缘节点”,确认边缘节点是否故障,如果故障请参见边缘节点故障如何处理?。 |
边缘节点不满足下发要求 |
|
边缘节点资源不足 |
|
容器镜像拉取失败 |
请参见容器镜像拉取失败。 |
边缘节点不满足下发要求
- 确认边缘节点资源信息是否正确。
- 如果边缘应用需要使用NPU、GPU资源,请确认注册和纳管的边缘节点是否选择了对应的类型。
- 在边缘节点通过docker ps命令查看NPU、GPU容器(npu-device-plugin、gpu-device-plugin)是否正常运行。
如果您是首次纳管节点,请参见容器应用在边缘节点启动失败处理。
- 确认边缘节点是否已经有应用使用了GPU、NPU资源,节点是否还有剩余资源。
- 确认IEF控制台上显示的边缘节点规格是否正确,CPU和内存信息是否有正常显示,如果内存显示为0,请确认边缘节点是否使用了中文版的操作系统。IEF服务仅支持英文版操作系统,中文版操作系统因无法有效获取内存信息从而会导致下发应用无法调度。因此需要您重装操作系统重新纳管节点。
重装前请确保您下载的安装包和证书文件已经保存,如果未保存,请将边缘节点删除后,重新注册新的边缘节点。
- 如果您要下发的是容器应用,请确认您的边缘节点是否启用了容器引擎。如果未启用容器引擎,您将无法下发容器应用。
边缘节点资源不足
- 查看容器异常的原因。
将您的鼠标放在实例状态旁的图标处,查看应用下发失败原因。
图2 实例列表
- 确认应用申请的资源大小。
确认边缘节点可用资源是否满足应用申请的资源量,确保边缘节点资源足够。
应用申请资源量的确认方法参考图3。
- 确定端口是否冲突,当端口冲突时,应用的实例无法正常启动。
进入应用详情页,单击“访问配置”页签,查看应用是否配置了指定端口的端口映射或者主机网络。
图4 访问配置