更新时间:2022-02-21 GMT+08:00

命令总览

边缘运维工具edgectl是一个帮助用户在边缘侧诊断故障问题的工具,支持定位节点IEF软件安装、IEF软件故障、应用程序故障等常见问题。该工具还支持一键式收集节点全量IEF数据进行远程故障诊断。同时,为应对节点损坏问题,支持节点上IEF软件进行数据无损迁移。

基本概念

  • diagnose(诊断):即对特定的故障场景进行全方位的诊断,定位故障原因。
  • collect(数据收集):即采集当前环境与IEF相关的全量信息,用于提供给IEF运维人员进行疑难问题定位和解决。
  • check(检查):即检查系统特定项是否满足IEF软件的安装和运行要求。

命令列表

表1 命令列表

分类

命令格式

功能描述

edgectl版本查询

edgectl version

获取命令行工具相关版本信息。

IEF产品生命周期管理

edgectl diagnose installation

判断节点是否满足IEF边缘软件的要求。

edgectl diagnose node-fault

诊断节点故障原因。

edgectl diagnose pod

诊断特定pod的故障原因。

edgectl collect

收集节点IEF相关的数据。

单独项检查

edgectl check arch

判断节点硬件架构IEF是否支持。

edgectl check cpu

判断cpu核数是否满足IEF要求。

edgectl check memory

检查系统内存大小,以及剩余内存量,并判断是否满足IEF需求。

edgectl check disk

检查系统硬盘是否满足IEF需求。

edgectl check dns

检查节点域名解析功能是否正常。

edgectl check docker

查看节点docker功能是否正常。

edgectl check network

检查节点是否能够跟IEF云上端点进行通信。

edgectl check ief-system-configure

检查IEF是否正确安装。

edgectl check ief-system-status

检查IEF软件运行状态。

edgectl check gpu

检查节点是否存在gpu设备,gpu驱动是否安装且运行正常。

edgectl check npu

检查节点是否存在npu设备。

edgectl check pid

检查环境当前进程数是否过多,当可用的进程数比例低于5%,认为进程数不足。