更新时间:2023-11-20 GMT+08:00

用户高频问题

新创建应用、服务等资源后,AOM界面为何不实时显示监控数据?

当您新创建了主机、应用、组件、进程等资源后,ICAgent会以10分钟为周期进行周期性监控数据上报,AOM界面需要等待一个上报周期后方可展示相关监控数据。

删除主机、工作负载等资源后,AOM界面为何仍然显示资源状态为正常?

当您在CCE集群中删除了主机或工作负载等资源后,在AOM“主机监控”或“容器监控”界面显示资源状态仍为正常。此为正常现象,这是由于AOM“主机监控”或“容器监控”界面不会立即将资源状态置为已删除,而是会等待30分钟后将已删除的资源状态置为已删除。

非华为云主机安装ICAgent后为何无数据上报?

当您在非华为云主机上安装了ICAgent后,ICAgent上报数据需要访问如下端口,如果本地有防火墙配置,请打开如下端口的出方向否则对应数据无法上报,对应功能不可用。

  • 8149: 上报指标数据使用
  • 8102: 上报日志数据使用
  • 8923: 上报APM(调用链、JVM)指标使用
  • 30200: ICAgent的控制端口
  • 30201: ICAgent的控制端口

如果界面上点击升级操作失败,该怎么办?

自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。

ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。

是否可通过拷贝已安装ICAgent节点镜像的方式安装其他节点?

非华为云主机场景下,如果通过先在一个节点上安装ICAgent,然后通过拷贝此节点镜像的方式安装其他节点,建议新节点上先卸载ICAgent再重新安装,否则可能出现不同节点间ID冲突的问题。因为ICAgent在每个节点上会自动生成唯一的ID文件,拷贝镜像后不同节点的ID文件可能会重复。

采集的日志文件是什么类型的?

在配置日志采集路径时,若日志采集路径配置的是目录,则默认采集目录下的日志(只采集*.log、*.trace和*.out类型的文本日志文件);若配置的为具体某个文件,则直接采集对应文件。指定文件必须为文本文件,不支持其他类型(例如二进制日志文件)的日志文件。

AOM能监控其他云服务商的服务器吗?

可以,您需要先购买一台华为云创建弹性云服务ECS作为跳板机用于监控数据的转发,同时需要在其他云服务商的服务器上安装ICAgent。详细的操作步骤参考安装ICAgent(非华为云主机)

采集器ICAgent对资源的占用大吗?例如内存、CPU。

  • AOM对基础指标的采集,包含VM、容器、进程的CPU、内存等基础指标。

    资源消耗:对此类指标采集时,采集器ICAgent对资源的消耗和容器、进程个数相关。 正常业务量情况下,采集器ICAgent消耗内存约30M、单核CPU约3%。

    使用限制:单节点上运行容器个数小于1000个。

    保护机制
    • 采集器ICAgent对CPU资源的消耗最大不超过2核。
    • 当采集器ICAgent对内存的消耗超过min{4G,节点物理内存/2}时,AOM将启动采集器重启保护。

      min{4G,节点物理内存/2}表示取“节点物理内存的一半”和“4G”中的较小值。

  • 日志文件的采集,包含了syslog、容器标准输出、用户配置路径、容器挂载等多种方式的日志文件采集。

    资源消耗:此类数据采集时,采集器ICAgent对资源的消耗和文件日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。

Agent管理页面中用户自定义接入主机的IP是如何获取的?

AOM会默认遍历虚机上的所有网卡设备,按照以太网卡、Bond网卡、无线网卡等优先级顺序获取IP,如果获取到的不是期望的地址,可以在启动ICAgent时设置进程的环境变量IC_NET_CARD=网卡名,获取指定网卡IP。

举例:

  1. 在/etc/profile中增加export IC_NET_CARD=eth2。
  2. 执行source /etc/profile使环境变量在当前shell生效。
  3. 进入/opt/oss/servicemgr/ICAgent/bin/manual/目录,停止并重新启动icagent。

    bash mstop.sh

    bash mstart.sh

  4. 查看该环境变量是否正确传递到应用中。

    strings /proc/{icagentprocid}/envrion | grep IC_NET_CARD

  • 如果ICAgent显示的IP地址是127.0.0.1,则可能是ICAgent启动时未获取到本机的IP导致,例如VM掉电重启时会出现。此时您需要重启ICAgent即可。
  • 若您的主机IP发生变更(例如续租时分配了新的IP),此时Agent管理页面中显示的可能还是原来的IP,需要您重启ICAgent即可。

Windows环境下安装icagent失败,并提示SERVICE STOP

现象:在Windows环境下安装icagent失败,提示SERVICE STOP。任务管理器中不存在icagent任务。系统服务列表中不存在icagent服务。命令行下执行sc query icagent提示未找到。

原因:一般为360安全卫士等杀毒软件拦截了icagent服务注册。

解决方法

  1. 检查360安全卫士等杀毒软件是否正在运行。
  2. 关闭360安全卫士后再进行icagent安装。

Windows下icagent采集文件类型需要手动配置采集路径*.log、 *.trace、 *.out等文本文件,不支持二进制文件、不支持Windows系统日志。

在ECS上手工安装ICAgent后提示安装成功,但采集器管理器界面上提示状态异常?

状态异常说明您安装的AK/SK等凭据不正确,或者使用委托安装的方式但没有设置委托导致,请参考如何通过创建委托获取AK/SK,重新安装即可。