日志、监控和告警
日志说明
边缘节点会上传系统日志和应用日志,您需要在IEF控制台上打开日志开关。
- 系统日志:边缘节点上IEF软件(如edge-core、edge-logger和edge-monitor等)产生的日志。
- 应用日志:边缘节点上部署的应用所产生的日志。
- 边缘节点会上传“/var/IEF/app/log”目录的日志,您可以在创建应用时将容器中目录挂载到“/var/IEF/app/log/{appName}”下,具体挂载方法请参见▪hostPath:将主机某个目录挂载到容器中。在AOM中可以按{appName}分类查看到应用的日志。
- 边缘节点会上传容器日志,日志组件会上传“{{DOCKER_ROOT_DIR}}/containers/{containerID}/{containerID}-json.log”文件的内容,DOCKER_ROOT_DIR可以通过docker info命令查询到,containerID就是容器ID。
在AOM查看日志
- 登录AOM管理控制台。
- 在左侧导航栏选择“日志 > 日志文件”,单击“组件”页签。
- 选择集群“ief_global”和命名空间“default”。
图1 选择集群和命名空间
- 搜索应用名称,单击日志文件右侧的“查看”,即可查看详细日志。
在AOM中查看节点监控信息
您可以在AOM查看节点监控信息。
- 登录AOM管理控制台。
- 选择监控的节点。
图2 选择监控节点
- 单击节点名称,在“监控视图”页签下,您可以查看节点的资源使用情况,如CPU、内存的使用率等。
图3 查看监控信息
在AOM中查看容器监控信息
AOM中可以查看边缘节点上容器应用的监控信息。
- 登录AOM管理控制台。
- 选择要监控的容器工作负载。
图4 选择工作负载
- 单击工作负载名称,进入详情页面,在“监控视图”页签下,您可以设置容器的监控指标,如CPU、内存的使用率等。
图5 查看监控信息
IEF预置的告警
IEF为每个边缘节点预置了7个告警规则,这7类告警会自动上报到AOM。
告警名称 |
触发条件 |
清除条件 |
告警等级 |
---|---|---|---|
容器引擎异常 |
边缘节点配置Docker使能时,查询Docker信息失败 |
Docker正常运行,EdgeCore能够获取到Docker信息 |
紧急 |
存活探针异常 |
应用配置存活探针,探针检测到异常 |
容器探针检测成功 |
重要 |
申请GPU资源失败 |
部署GPU应用,申请GPU资源失败 |
成功申请到GPU资源 |
紧急 |
获取GPU信息失败 |
边缘节点配置GPU使能时,查询GPU信息失败 |
成功查询到GPU信息 |
紧急 |
AK/SK无效 |
EdgeHub连续10次分发临时AK/SK,检测到过期或者状态异常 |
EdgeHub成功分发临时AK/SK |
重要 |
应用重启 |
应用容器异常重启 |
无需清除 |
次要 |
容器绑定网卡异常 |
容器绑定的网卡发生异常 |
容器绑定的网卡状态正常 |
紧急 |
在AOM中设置告警
您可以在AOM中创建告警规则来监控边缘节点上的各项指标,请参考创建阈值规则进行设置。