管理ICAgent
ICAgent安装成功后,支持升级ICAgent、卸载ICAgent、查看ICAgent状态、查看ICAgent版本说明。
升级ICAgent
为了更好的采集体验,LTS会不断更新ICAgent版本。当系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。
如果需要升级Windows环境中的ICAgent,请先卸载旧版本ICAgent,再安装新版本ICAgent即可。
- 在云日志服务管理控制台,左侧导航栏选择“主机管理 > 主机”,进入“主机”页面。
- 选择“区域内主机”或“区域外主机”,当系统提示您有新的ICAgent版本时,在主机列表中选中一个或多个待升级ICAgent前的复选框,单击“升级ICAgent”。
图1 区域内主机升级ICAgent
图2 区域外主机升级ICAgent
- 选择“CCE集群”,在搜索框中选择待升级ICAgent的集群,单击“升级ICAgent”。
图3 CCE集群升级ICAgent
- 未创建CCE集群时,采集容器标准输出到AOM的开关为置灰状态。
- 当ICAgent版本号为5.12.133及以上时,支持关闭采集容器标准输出到AOM的开关功能。
- 首次创建的CCE集群,默认集群下的主机已安装了ICAgent且上报日志到AOM,采集容器标准输出到AOM的开关处于开启状态;如需将日志上报至LTS则执行升级ICAgent操作时,关闭采集容器标准输出到AOM的开关。建议使用“接入日志 > 云服务接入 > 云容器引擎CCE”直接采集容器标准输出到LTS,不推荐采集到AOM。
- CCE集群ID(ClusterID): 每个集群为固定的ID。
- 升级ICAgent时,LTS将为您的CCE集群创建对应的日志组和主机组。且该日志组和主机组的名称为k8s-log-{ClusterID}。您可以创建接入配置(云服务接入>云容器引擎CCE)将当前CCE集群的日志接入到该日志组。
- 当集群里的主机未安装ICAgent或ICAgent版本过低时,单击“升级ICAgent”操作,可对该集群里的所有主机安装ICAgent。
- 在“升级ICAgent”对话框中单击“确定”。
ICAgent开始升级,升级ICAgent预计需要1分钟左右,请耐心等待。待ICAgent的状态由“升级中”变为“运行”时,表示升级成功。
如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。
卸载ICAgent
服务器上的ICAgent被卸载后,会影响该服务器的日志采集能力,请谨慎操作!
云日志服务主机管理界面,仅支持卸载安装在Linux环境中的ICAgent,如果需要卸载安装Windows环境中的ICAgent,请在ICAgent安装包解压目录下,双击执行“ICAgent安装包解压目录\ICProbeAgent\bin\manual\win\uninstall.bat”脚本,当显示“ICAgent uninstall success”时,表示卸载成功。
卸载ICAgent不会删除对应的安装文件,请您根据实际情况自行删除。
卸载方式,您可以按照需要进行选择:
- 通过界面卸载:此操作适用于正常安装ICAgent后需卸载的场景。
- 登录服务器卸载:此操作适用于未成功安装ICAgent需卸载重装的场景。
- 以root用户登录需卸载ICAgent的服务器。
- 执行如下命令卸载ICAgent。
bash /opt/oss/servicemgr/ICAgent/bin/manual/uninstall.sh
当显示“ICAgent uninstall success”时,表示卸载成功。
- 远程卸载:此操作适用于正常安装ICAgent后需远程卸载的场景。
除了上述登录服务器上执行uninstall.sh命令卸载ICAgent的方式,还可以对服务器进行远程卸载。
- 在已安装ICAgent的服务器上执行如下命令,其中x.x.x.x表示待卸载ICAgent的服务器的IP地址。
bash /opt/oss/servicemgr/ICAgent/bin/remoteUninstall/remote_uninstall.sh -ip x.x.x.x
- 根据提示输入待卸载ICAgent的服务器root用户密码。
- 如果已安装ICAgent的服务器安装过expect工具,执行上述命令后,即可完成卸载。如果已安装ICAgent的服务器未安装expect工具,请根据提示输入密码,进行卸载。
- 请确保已安装ICAgent的服务器可以使用root用户执行SSH、SCP命令,来与待卸载ICAgent的服务器进行远端通信。
- 当显示“ICAgent uninstall success”时,表示卸载成功。
- 在已安装ICAgent的服务器上执行如下命令,其中x.x.x.x表示待卸载ICAgent的服务器的IP地址。
- 批量卸载:此操作适用于正常安装ICAgent后需批量卸载的场景。
当您已有服务器安装过ICAgent,且该服务器“/opt/ICAgent/”路径下存在ICAgent安装包ICProbeAgent.tar.gz,通过该方式可对多个服务器进行一键式继承批量卸载。
批量卸载的服务器需同属一个VPC下,并在同一个网段中。
前提条件
已收集需要卸载Agent的所有服务器的IP地址、密码,按照iplist.cfg格式整理好,并上传到已安装过ICAgent机器的/opt/ICAgent/目录下。iplist.cfg格式示例如下所示,IP地址与密码之间用空格隔开:
192.168.0.109 密码(请根据实际填写)
192.168.0.39 密码(请根据实际填写)
- iplist.cfg中包含您的敏感信息,建议您使用完之后进行清理。
- 如果所有服务器的密码一致,iplist.cfg中只需列出IP地址,无需填写密码,在执行时输入此密码即可;如果某个IP密码与其他不一致,则需在此IP地址后填写其密码。
- 在已安装ICAgent的服务器上执行如下命令。
bash /opt/oss/servicemgr/ICAgent/bin/remoteUninstall/remote_uninstall.sh -batchModeConfig /opt/ICAgent/iplist.cfg
根据脚本提示输入待卸载机器的root用户默认密码,如果所有IP地址的密码在iplist.cfg中已有配置,则直接输入回车键跳过即可,否则请输入默认密码。
batch uninstall begin Please input default passwd: send cmd to 192.168.0.109 send cmd to 192.168.0.39 2 tasks running, please wait... End of uninstall agent: 192.168.0.109 End of uninstall agent: 192.168.0.39 All hosts uninstall icagent finish.
请耐心等待,当提示All hosts uninstall icagent finish.时,则表示配置文件中所有服务器的卸载操作已完成。
- 卸载完成后,在云日志服务左侧导航栏中选择“主机管理 > 主机”,查看该服务器的ICAgent状态。
查看ICAgent状态
左侧导航栏选择“主机管理 > 主机”,查看目标主机的ICAgent状态。详细请参见表1。
状态 |
说明 |
---|---|
运行 |
该服务器的ICAgent运行正常。 |
未安装 |
该服务器未安装ICAgent。 |
安装中 |
正在为该主机安装ICAgent。安装ICAgent预计需要1分钟左右,请耐心等待。 |
安装失败 |
该主机的ICAgent安装失败。 |
升级中 |
正在升级该服务器的ICAgent。升级ICAgent预计需要1分钟左右,请耐心等待。 |
升级失败 |
该服务器的ICAgent升级失败。 |
离线 |
输入的AK/SK错误导致该主机的ICAgent功能异常。请获取正确的AK/SK后重新安装。 |
异常 |
该主机ICAgent功能异常,请联系技术支持。 |
卸载中 |
正在卸载该主机。卸载ICAgent预计需要1分钟左右,请耐心等待。 |
鉴权错误 |
安装该主机时配置的参数问题导致无法正常鉴权。 |
查看ICAgent版本说明
左侧导航栏选择“主机管理 > 主机”,查看目标主机的ICAgent版本。详细请参见表2。
版本号 |
说明 |
发布时间 |
---|---|---|
5.12.232 |
|
2024-10-14 |
5.12.231 |
|
2024-10-11 |
5.12.230 |
|
2024-10-09 |
5.12.224 |
在ECS升级场景下,若“.bashrc文件中export HISTSIZE=0”大于1条,则清除“.bashrc文件中的export HISTSIZE=0”。 |
2024-09-27 |
5.12.218 |
|
2024-09-26 |
5.12.185 |
|
2024-05-20 |
5.12.184 |
|
2024-05-16 |
5.12.183 |
优化containerd节点采集容器标准输出绕接文件的问题。 |
2024-05-11 |
5.12.182 |
解决syslog开关问题。 |
2024-04-28 |
5.12.181 |
|
2024-04-25 |
5.12.177 |
解决绕接死循环问题。 |
2024-03-28 |
5.12.176 |
|
2024-03-18 |
5.12.175 |
解决了结构化日志采集性能瓶颈问题。 |
2024-03-13 |
5.12.172 |
优化支持的绕接方式。 |
2024-02-28 |
5.12.171 |
解决Docker节点标准输出日志Json解析问题(没有去掉转义字符)。 |
2024-01-31 |
5.12.170 |
|
2024-01-29 |
5.12.166 |
|
2023-12-27 |
5.12.165 |
从配置文件获取初始agentID,如果不符合校验要求则使用随机生成的uuid。 |
2023-12-21 |
5.12.163 |
支持UniAgent插件化安装ICAgent。 |
2023-12-13 |
5.12.159 |
|
2023-11-27 |
5.12.158 |
解决关闭指标开关后容器指标内存泄露导致ICAgent重启的问题。 |
2023-11-08 |
5.12.157 |
|
2023-11-06 |
5.12.156 |
解决从OBS拉取安装包问题,将http协议改成https。 |
2023-11-01 |
5.12.154 |
支持结构化功能。 |
2023-10-31 |
5.12.153 |
Release7版本。 |
2023-10-19 |
5.12.150 |
|
2023-10-17 |
5.12.149 |
支持挂载绕接功能。 |
2023-10-12 |
5.12.148 |
修复gpu多卡场景,解决cpu高的问题。 |
2023-08-30 |
5.12.147 |
修复日志转储无法重启、主机gpu指标适配。 |
2023-08-17 |
5.12.142 |
支持CCE集群1.25及以上版本的容器gpu指标采集。 |
2023-06-13 |
5.12.139 |
解决上报LTS日志出现大量TIME_WAIT状态的TCP连接问题。 |
2023-04-25 |
5.12.135 |
|
2023-02-08 |
5.12.133 |
容器的标准输出日志支持多行采集。 |
2022-12-17 |
5.12.130 |
支持将CCE日志直接接入LTS。 |
2022-11-04 |
5.12.120 |
|
2022-08-28 |
5.12.111 |
新增线程指标、修复“获取lvs磁盘分区指标失败”问题。 |
2022-06-09 |
5.12.100 |
|
2022-01-15 |
5.12.98 |
增加LTS日志黑名单功能,更改容器指标来源为working_set。 |
2021-09-29 |
5.12.96 |
新增云资源发现类型。 |
2021-09-22 |
5.12.90 |
更新gpu指标来源。 |
2021-07-15 |
5.12.87 |
新增磁盘支持类型。 |
2021-03-30 |
5.12.75 |
适配安全容器场景。 |
2021-03-09 |