用户高频问题
新创建应用、服务等资源后,AOM界面为何不实时显示监控数据?
当您新创建了主机、应用、组件、进程等资源后,ICAgent会以10分钟为周期进行周期性监控数据上报,AOM界面需要等待一个上报周期后方可展示相关监控数据。
删除主机、工作负载等资源后,AOM界面为何仍然显示资源状态为正常?
当您在CCE集群中删除了主机或工作负载等资源后,在AOM“主机监控”或“容器监控”界面显示资源状态仍为正常。此为正常现象,这是由于AOM“主机监控”或“容器监控”界面不会立即将资源状态置为已删除,而是会等待30分钟后将已删除的资源状态置为已删除。
如果界面上点击升级操作失败,该怎么办?
自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。
ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。
采集的日志文件是什么类型的?
在配置日志采集路径时,若日志采集路径配置的是目录,则默认采集目录下的日志(只采集*.log、*.trace和*.out类型的文本日志文件);若配置的为具体某个文件,则直接采集对应文件。指定文件必须为文本文件,不支持其他类型(例如二进制日志文件)的日志文件。
采集器ICAgent对资源的占用大吗?例如内存、CPU。
- AOM对基础指标的采集,包含VM、容器、进程的CPU、内存等基础指标。
资源消耗:对此类指标采集时,采集器ICAgent对资源的消耗和容器、进程个数相关。 正常业务量情况下,采集器ICAgent消耗内存约30M、单核CPU约3%。
使用限制:单节点上运行容器个数小于1000个。
保护机制:- 采集器ICAgent对CPU资源的消耗最大不超过2核。
- 当采集器ICAgent对内存的消耗超过min{4G,节点物理内存/2}时,AOM将启动采集器重启保护。
min{4G,节点物理内存/2}表示取“节点物理内存的一半”和“4G”中的较小值。
- 日志文件的采集,包含了syslog、容器标准输出、用户配置路径、容器挂载等多种方式的日志文件采集。
资源消耗:此类数据采集时,采集器ICAgent对资源的消耗和文件日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。
Agent管理页面中用户自定义接入主机的IP是如何获取的?
AOM会默认遍历虚机上的所有网卡设备,按照以太网卡、Bond网卡、无线网卡等优先级顺序获取IP,如果获取到的不是期望的地址,可以在启动ICAgent时设置进程的环境变量IC_NET_CARD=网卡名,获取指定网卡IP。
举例:
- 在/etc/profile中增加export IC_NET_CARD=eth2。
- 执行source /etc/profile使环境变量在当前shell生效。
- 进入/opt/oss/servicemgr/ICAgent/bin/manual/目录,停止并重新启动icagent。
bash mstart.sh
- 查看该环境变量是否正确传递到应用中。
- 如果ICAgent显示的IP地址是127.0.0.1,则可能是ICAgent启动时未获取到本机的IP导致,例如VM掉电重启时会出现。此时您需要重启ICAgent即可。
- 若您的主机IP发生变更(例如续租时分配了新的IP),此时Agent管理页面中显示的可能还是原来的IP,需要您重启ICAgent即可。
Windows环境下安装icagent失败,并提示SERVICE STOP
现象:在Windows环境下安装icagent失败,提示SERVICE STOP。任务管理器中不存在icagent任务。系统服务列表中不存在icagent服务。命令行下执行sc query icagent提示未找到。
原因:一般为360安全卫士等杀毒软件拦截了icagent服务注册。
解决方法:
- 检查360安全卫士等杀毒软件是否正在运行。
- 关闭360安全卫士后再进行icagent安装。
Windows下icagent采集文件类型需要手动配置采集路径*.log、 *.trace、 *.out等文本文件,不支持二进制文件、不支持Windows系统日志。