文档首页/ 安全云脑 SecMaster/ 常见问题/ 数据采集故障排查/ 采集节点或采集通道故障

更新时间：2024-09-19 GMT+08:00

查看PDF

采集节点或采集通道故障

问题现象

采集节点状态和采集通道健康状态采用isap-agent定时上报机制，虽然存在一定的延迟（预计一分钟），但是在采集通道下发3分钟后，采集节点和采集通道的“健康状态”依然显示为“故障”，并且该服务器的CPU使用率或内存使用率即将达到100%。

图1 采集节点故障

图2 采集通道故障

可能原因

用户配置的连接器或解析器在语法或者语义上存在错误，导致采集器无法正常运行，不断重启导致CPU、内存被占满。

问题定位

远程登录采集节点所在的ECS。
- 您可以登录弹性云服务器控制台，在“弹性云服务器”列表中，单击“远程登录”登录主机，详细操作请参见在云服务器控制台上登录主机。
- 如果您的主机已经绑定了弹性IP，您也可以使用远程管理工具（例如：PuTTY、Xshell等）登录主机，并使用root账号在主机中安装组件控制器。
执行如下命令，命令查看当前系统的运行状态：
top

当显示如下图所示时，则表示ECS中Java进程占用了大量CPU资源。

图3 运行状态
执行如下命令，查看采集器运行日志：
docker logs isap-logstash -f

通过查看日志，定位到当前采集通道filter部分（解析器）配置有误，如下图所示：

图4 采集器运行日志
执行以下命令，进入采集通道配置文件所在路径。
cd /opt/cloud/logstash/config/files
执行以下命令，查看filter部分是否存在异常。
cat 配置文件名

当出现如下图所示内容时，则表示当前filter部分存在异常：

图5 filter部分存在异常

处理步骤

登录安全云脑管理控制台，并进入目标工作空间。
在左侧导航栏选择“设置 > 采集管理”，进入采集管理页面后，选择“解析器管理”页签，进入解析器管理页面。

图6 进入解析器管理页面
单击目标解析器所在行操作列的“编辑”，并在编辑页面中，删除错误配置信息，修改为正确的配置信息。

图7 问题解析器配置

图8 修改解析器配置
单击“确定”。
编辑完成后，在上方选择“采集通道管理”页签，并单击目标采集通道操作列的“重启”，重启采集通道。

图9 重启采集通道
检查采集通道和采集节点状态。
- 重启完成后，在“采集通道管理”页面中，检查目标采集通道的健康状态。
  图10 采集通道健康状态
- 在上方选择“采集节点管理”页签，页面，检查目标采集节点的健康状态。
  图11 采集节点健康状态
当采集通道和采集节点的“健康状态”均显示为“正常”时，则表示问题处理成功。

父主题： 数据采集故障排查

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问