更新时间:2024-11-11 GMT+08:00

管理ICAgent

ICAgent安装成功后,支持升级ICAgent卸载ICAgent查看ICAgent状态查看ICAgent版本说明

升级ICAgent

为了更好的采集体验,LTS会不断更新ICAgent版本。当系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。

如果需要升级Windows环境中的ICAgent,请先卸载旧版本ICAgent,再安装新版本ICAgent即可。

  1. 在云日志服务管理控制台,左侧导航栏选择“主机管理 > 主机”,进入“主机”页面。
  2. 选择“区域内主机”或“区域外主机”,当系统提示您有新的ICAgent版本时,在主机列表中选中一个或多个待升级ICAgent前的复选框,单击“升级ICAgent”。

    图1 区域内主机升级ICAgent

  3. 选择“CCE集群”,在搜索框中选择待升级ICAgent的集群,单击“升级ICAgent”。

    图2 CCE集群升级ICAgent
    • 未创建CCE集群时,采集容器标准输出到AOM的开关为置灰状态。
    • 当ICAgent版本号为5.12.133及以上时,支持关闭采集容器标准输出到AOM的开关功能。
    • 首次创建的CCE集群,默认集群下的主机已安装了ICAgent且上报日志到AOM,采集容器标准输出到AOM的开关处于开启状态;如需将日志上报至LTS则执行升级ICAgent操作时,关闭采集容器标准输出到AOM的开关。建议使用“接入日志 > 云服务接入 > 云容器引擎CCE”直接采集容器标准输出到LTS,不推荐采集到AOM。
    • CCE集群ID(ClusterID): 每个集群为固定的ID。
    • 升级ICAgent时,LTS将为您的CCE集群创建对应的日志组和主机组。且该日志组和主机组的名称为k8s-log-{ClusterID}。您可以创建接入配置(云服务接入>云容器引擎CCE)将当前CCE集群的日志接入到该日志组。
    • 当集群里的主机未安装ICAgent或ICAgent版本过低时,单击“升级ICAgent”操作,可对该集群里的所有主机安装ICAgent。

  4. 在“升级ICAgent”对话框中单击“确定”。

    ICAgent开始升级,升级ICAgent预计需要1分钟左右,请耐心等待。待ICAgent的状态由“升级中”变为“运行”时,表示升级成功。

    如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。

卸载ICAgent

服务器上的ICAgent被卸载后,会影响该服务器的日志采集能力,请谨慎操作!

云日志服务主机管理界面,仅支持卸载安装在Linux环境中的ICAgent,如果需要卸载安装Windows环境中的ICAgent,请在ICAgent安装包解压目录下,双击执行“ICAgent安装包解压目录\ICProbeAgent\bin\manual\win\uninstall.bat”脚本,当显示“ICAgent uninstall success”时,表示卸载成功。

卸载ICAgent不会删除对应的安装文件,请您根据实际情况自行删除。

卸载方式,您可以按照需要进行选择:

  • 通过界面卸载:此操作适用于正常安装ICAgent后需卸载的场景。
    1. 在云日志服务管理控制台,左侧导航栏选择“主机管理 > 主机”,进入“主机”页面。
    2. 勾选一个或多个待卸载ICAgent的服务器的复选框,单击“卸载ICAgent”。
    3. 在“卸载ICAgent”对话框中单击“确定”。

      ICAgent开始卸载,卸载ICAgent预计需要1分钟左右,请耐心等待。

      卸载完成后主机列表中将不会显示该主机。

      通过界面卸载ICAgent后如果需要再次安装,请等待5分钟后执行安装操作,否则可能出现被再次自动卸载的情况。

  • 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。
    1. root用户登录需卸载ICAgent的服务器。
    2. 执行如下命令卸载ICAgent。
      bash /opt/oss/servicemgr/ICAgent/bin/manual/uninstall.sh

      当显示“ICAgent uninstall success”时,表示卸载成功。

  • 远程卸载:此操作适用于正常安装ICAgent后需远程卸载的场景。

    除了上述登录服务器上执行uninstall.sh命令卸载ICAgent的方式,还可以对服务器进行远程卸载。

    1. 在已安装ICAgent的服务器上执行如下命令,其中x.x.x.x表示待卸载ICAgent的服务器的IP地址。
      bash /opt/oss/servicemgr/ICAgent/bin/remoteUninstall/remote_uninstall.sh -ip x.x.x.x
    2. 根据提示输入待卸载ICAgent的服务器root用户密码。
      • 如果已安装ICAgent的服务器安装过expect工具,执行上述命令后,即可完成卸载。如果已安装ICAgent的服务器未安装expect工具,请根据提示输入密码,进行卸载。
      • 请确保已安装ICAgent的服务器可以使用root用户执行SSH、SCP命令,来与待卸载ICAgent的服务器进行远端通信。
      • 当显示“ICAgent uninstall success”时,表示卸载成功。
  • 批量卸载:此操作适用于正常安装ICAgent后需批量卸载的场景。

    当您已有服务器安装过ICAgent,且该服务器“/opt/ICAgent/”路径下存在ICAgent安装包ICProbeAgent.tar.gz,通过该方式可对多个服务器进行一键式继承批量卸载。

    批量卸载的服务器需同属一个VPC下,并在同一个网段中。

    前提条件

    已收集需要卸载Agent的所有服务器的IP地址、密码,按照iplist.cfg格式整理好,并上传到已安装过ICAgent机器的/opt/ICAgent/目录下。iplist.cfg格式示例如下所示,IP地址与密码之间用空格隔开:

    192.168.0.109 密码(请根据实际填写)

    192.168.0.39 密码(请根据实际填写)

    • iplist.cfg中包含您的敏感信息,建议您使用完之后进行清理。
    • 如果所有服务器的密码一致,iplist.cfg中只需列出IP地址,无需填写密码,在执行时输入此密码即可;如果某个IP密码与其他不一致,则需在此IP地址后填写其密码。
    1. 在已安装ICAgent的服务器上执行如下命令。
      bash /opt/oss/servicemgr/ICAgent/bin/remoteUninstall/remote_uninstall.sh -batchModeConfig /opt/ICAgent/iplist.cfg

      根据脚本提示输入待卸载机器的root用户默认密码,如果所有IP地址的密码在iplist.cfg中已有配置,则直接输入回车键跳过即可,否则请输入默认密码。

      batch uninstall begin
      Please input default passwd:
      send cmd to 192.168.0.109
      send cmd to 192.168.0.39
      2 tasks running, please wait...
      End of uninstall agent: 192.168.0.109
      End of uninstall agent: 192.168.0.39
      All hosts uninstall icagent finish.

      请耐心等待,当提示All hosts uninstall icagent finish.时,则表示配置文件中所有服务器的卸载操作已完成。

    2. 卸载完成后,在云日志服务左侧导航栏中选择“主机管理 > 主机”,查看该服务器的ICAgent状态。

查看ICAgent状态

左侧导航栏选择“主机管理 > 主机”,查看目标主机的ICAgent状态。详细请参见表1

表1 ICAgent状态

状态

说明

运行

该服务器的ICAgent运行正常。

未安装

该服务器未安装ICAgent。

安装中

正在为该主机安装ICAgent。安装ICAgent预计需要1分钟左右,请耐心等待。

安装失败

该主机的ICAgent安装失败。

升级中

正在升级该服务器的ICAgent。升级ICAgent预计需要1分钟左右,请耐心等待。

升级失败

该服务器的ICAgent升级失败。

离线

输入的AK/SK错误导致该主机的ICAgent功能异常。请获取正确的AK/SK后重新安装。

异常

该主机ICAgent功能异常,请联系技术支持。

卸载中

正在卸载该主机。卸载ICAgent预计需要1分钟左右,请耐心等待。

鉴权错误

安装该主机时配置的参数问题导致无法正常鉴权。

查看ICAgent版本说明

左侧导航栏选择“主机管理 > 主机”,查看目标主机的ICAgent版本。详细请参见表2

表2 ICAgent版本说明

版本号

说明

发布时间

5.12.232

  • 解析标准输出日志用到的json库替换为sonic,降低CPU使用率。
  • LTS发送日志出现超时,解决超时问题。

2024-10-14

5.12.231

  • 解决以下条件满足的情况下ICAgent重启的问题:标准输出采集到LTS、LTS不配置日志接入规则、CCE创建新容器并打印标准输出日志。
  • 解决游标文件中hisfile变成目录的问题。
  • 解决增量采集开关不生效的问题。

2024-10-11

5.12.230

  • 解决游标定时刷新功能不生效的问题。
  • 查找不到绕接文件的情况下,解决base文件绕接后无法重置游标的问题。
  • 解决文件签名导致cpu高的问题。

2024-10-09

5.12.224

在ECS升级场景下,若“.bashrc文件中export HISTSIZE=0”大于1条,则清除“.bashrc文件中的export HISTSIZE=0”。

2024-09-27

5.12.218

  • ICAgent上报日志支持GBK编码。
  • ICAgent上报日志允许文件多次采集。

2024-09-26

5.12.185

  • 解决虚机日志配置中黑名单路径不生效问题。
  • 优化containerd标准输出日志采集的问题。

2024-05-20

5.12.184

  • 解决容器日志采集功能中无法排除绕接文件的问题。
  • 节点日志采集功能并发采集协程调整为32个。

2024-05-16

5.12.183

优化containerd节点采集容器标准输出绕接文件的问题。

2024-05-11

5.12.182

解决syslog开关问题。

2024-04-28

5.12.181

  • 解决自建k8s icagent认证失败问题。
  • 解决日志截断问题。
  • 解决日志速率很大的情况下,查找不到绕接文件导致文件漏采的问题。

2024-04-25

5.12.177

解决绕接死循环问题。

2024-03-28

5.12.176

  • zip流式解析优化:检查转储文件是否结束。
  • 限制podlb每个主机最大连接数。

2024-03-18

5.12.175

解决了结构化日志采集性能瓶颈问题。

2024-03-13

5.12.172

优化支持的绕接方式。

2024-02-28

5.12.171

解决Docker节点标准输出日志Json解析问题(没有去掉转义字符)。

2024-01-31

5.12.170

  • 主机日志,容器日志,标准输出日志支持增量采集。
  • 解决主机gpu指标挂断问题。

2024-01-29

5.12.166

  • 解决标准输出日志采集插件占用内存高问题。
  • 解决虚机日志采集插件重复采集绕接文件问题。
  • 游标文件中添加日志组和日志流信息。

2023-12-27

5.12.165

从配置文件获取初始agentID,如果不符合校验要求则使用随机生成的uuid。

2023-12-21

5.12.163

支持UniAgent插件化安装ICAgent。

2023-12-13

5.12.159

  • 解决标准输出日志采集协程泄露问题。
  • 解决标准输出日志采集到AOM后,不支持采集标准输出绕接日志的问题。

2023-11-27

5.12.158

解决关闭指标开关后容器指标内存泄露导致ICAgent重启的问题。

2023-11-08

5.12.157

  • CCE接入LTS的容器日志采集:支持Docker驱动Devicemapper。
  • 解决虚机日志量大(转储快)ICAgent内存暴涨导致重启问题。

2023-11-06

5.12.156

解决从OBS拉取安装包问题,将http协议改成https。

2023-11-01

5.12.154

支持结构化功能。

2023-10-31

5.12.153

Release7版本。

2023-10-19

5.12.150

  • 解决集群name和集群id not-set问题。
  • 支持CCE集群1.27版本。

2023-10-17

5.12.149

支持挂载绕接功能。

2023-10-12

5.12.148

修复gpu多卡场景,解决cpu高的问题。

2023-08-30

5.12.147

修复日志转储无法重启、主机gpu指标适配。

2023-08-17

5.12.142

支持CCE集群1.25及以上版本的容器gpu指标采集。

2023-06-13

5.12.139

解决上报LTS日志出现大量TIME_WAIT状态的TCP连接问题。

2023-04-25

5.12.135

  • 解决CPU使用率为0的问题。
  • 解决CCE1.23版本集群containerd节点容器网络指标缺失问题。
  • 支持采集EulerOS 2.5系统的磁盘分区指标。

2023-02-08

5.12.133

容器的标准输出日志支持多行采集。

2022-12-17

5.12.130

支持将CCE日志直接接入LTS。

2022-11-04

5.12.120

  • 增加进程的最大句柄数指标。
  • 支持LTS的podlb域名的切换能力。

2022-08-28

5.12.111

新增线程指标、修复“获取lvs磁盘分区指标失败”问题。

2022-06-09

5.12.100

  • 上报内存指标增加内存workingset使用量、内存workingset使用率。
  • 容器采集支持通过标签区分stderr.log和stdout.log。
  • 容器上报增加Pod_ip的tag。
  • **配置匹配当前目录文件。

2022-01-15

5.12.98

增加LTS日志黑名单功能,更改容器指标来源为working_set。

2021-09-29

5.12.96

新增云资源发现类型。

2021-09-22

5.12.90

更新gpu指标来源。

2021-07-15

5.12.87

新增磁盘支持类型。

2021-03-30

5.12.75

适配安全容器场景。

2021-03-09