更新时间:2024-08-05 GMT+08:00

用户高频问题

新创建应用、服务等资源后,AOM界面为何不实时显示监控数据?

当您新创建了主机、应用、组件、进程等资源后,ICAgent会以10分钟为周期进行周期性监控数据上报,AOM界面需要等待一个上报周期后方可展示相关监控数据。

删除主机、工作负载等资源后,AOM界面为何仍然显示资源状态为正常?

当您在CCE集群中删除了主机或工作负载等资源后,在AOM“主机监控”或“容器监控”界面显示资源状态仍为正常。此为正常现象,这是由于AOM“主机监控”或“容器监控”界面不会立即将资源状态置为已删除,而是会等待30分钟后将已删除的资源状态置为已删除。

如果界面上点击升级操作失败,该怎么办?

自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。

ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。

采集的日志文件是什么类型的?

在配置日志采集路径时,若日志采集路径配置的是目录,则默认采集目录下的日志(只采集*.log、*.trace和*.out类型的文本日志文件);若配置的为具体某个文件,则直接采集对应文件。指定文件必须为文本文件,不支持其他类型(例如二进制日志文件)的日志文件。

采集器ICAgent对资源的占用大吗?例如内存、CPU。

  • AOM对基础指标的采集,包含VM、容器、进程的CPU、内存等基础指标。

    资源消耗:对此类指标采集时,采集器ICAgent对资源的消耗和容器、进程个数相关。 正常业务量情况下,采集器ICAgent消耗内存约30M、单核CPU约3%。

    使用限制:单节点上运行容器个数小于1000个。

    保护机制
    • 采集器ICAgent对CPU资源的消耗最大不超过2核。
    • 当采集器ICAgent对内存的消耗超过min{4G,节点物理内存/2}时,AOM将启动采集器重启保护。

      min{4G,节点物理内存/2}表示取“节点物理内存的一半”和“4G”中的较小值。

  • 日志文件的采集,包含了syslog、容器标准输出、用户配置路径、容器挂载等多种方式的日志文件采集。

    资源消耗:此类数据采集时,采集器ICAgent对资源的消耗和文件日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。

Agent管理页面中用户自定义接入主机的IP是如何获取的?

AOM会默认遍历虚机上的所有网卡设备,按照以太网卡、Bond网卡、无线网卡等优先级顺序获取IP,如果获取到的不是期望的地址,可以在启动ICAgent时设置进程的环境变量IC_NET_CARD=网卡名,获取指定网卡IP。

举例:

  1. 在/etc/profile中增加export IC_NET_CARD=eth2。
  2. 执行source /etc/profile使环境变量在当前shell生效。
  3. 进入/opt/oss/servicemgr/ICAgent/bin/manual/目录,停止并重新启动icagent。

    bash mstop.sh

    bash mstart.sh

  4. 查看该环境变量是否正确传递到应用中。

    strings /proc/{icagentprocid}/envrion | grep IC_NET_CARD

  • 如果ICAgent显示的IP地址是127.0.0.1,则可能是ICAgent启动时未获取到本机的IP导致,例如VM掉电重启时会出现。此时您需要重启ICAgent即可。
  • 若您的主机IP发生变更(例如续租时分配了新的IP),此时Agent管理页面中显示的可能还是原来的IP,需要您重启ICAgent即可。

Windows环境下安装icagent失败,并提示SERVICE STOP

现象:在Windows环境下安装icagent失败,提示SERVICE STOP。任务管理器中不存在icagent任务。系统服务列表中不存在icagent服务。命令行下执行sc query icagent提示未找到。

原因:一般为360安全卫士等杀毒软件拦截了icagent服务注册。

解决方法

  1. 检查360安全卫士等杀毒软件是否正在运行。
  2. 关闭360安全卫士后再进行icagent安装。

Windows下icagent采集文件类型需要手动配置采集路径*.log、 *.trace、 *.out等文本文件,不支持二进制文件、不支持Windows系统日志。