数据采集概述

安全云脑的日志采集功能支持将安全日志接入安全云脑，同时，也支持将安全云脑日志转出至第三方系统/产品。

表1 日志接入或转出场景说明
场景	操作指导
云服务日志接入安全云脑	具体操作请参见接入日志数据。可以一键接入多个云服务产品日志。
第三方日志接入安全云脑	通过数据采集方式接入第三方日志数据。本章节介绍数据采集功能。
安全云脑日志转出至第三方系统/产品	与第三方日志接入安全云脑步骤相同。主要区别在于：将非当前云上日志接入安全云脑场景时，需要执行创建日志存储管道步骤。将当前云上日志转出至第三方系统或产品场景，请跳过此步骤。配置连接器的时候，数据连接来源和目的参数配置有差异。将非当前云上日志接入安全云脑场景时，数据连接目的参数配置的时候连接类型参数选择“云脑管道（Pipe）”。安全云脑日志转出至第三方系统/产品场景时，数据连接来源参数配置的时候连接类型参数选择“云脑管道（Pipe）”。

本章节介绍接入第三方日志数据。通过数据采集方式接入第三方日志数据，使用Logstash通过多种方式采集各类日志数据，采集后，可以快速实现历史数据分析比对、数据关联分析、以及未知威胁发现等相关分析。

图1 数据采集

数据采集的基本原理是安全云脑提供组件控制器（isap-agent），安装在租户云服务器上，通过组件控制器来管理采集组件Logstash，通过Logstash完成租户自身、租户与安全云脑数据的收发工作。

图2 采集系统功能架构

采集器：定制化的Logstash。采集器节点则是定制化的Logstash+组件控制器（isap-agent）。
节点：安装了组件控制器（isap-agent），并被安全云脑纳管的云服务器叫做节点。节点纳管成功后，即可在组件管理中下发采集引擎Logstash。
组件：为了很好地完成业务而定制的软件，目前提供汇聚式收集引擎Logstash用于租户日志收发安全云脑业务。
连接器：Logstash配置的基础概念，主要包括input、output两部分，分别对应源连接器、目的连接器，用于定义采集器Logstash接收数据方式和规范。其中，安全云脑管道pipe连接器可以对接安全云脑，实现租户数据上报安全云脑，安全云脑数据转储到租户的能力。
解析器：Logstash配置的基础概念，主要为Logstash的filter部分，安全云脑解析器是对其filter部分的无码化封装和定制，用户只需在页面上配置解析器规则即可生成原生的filter配置脚本，从而轻松实现将原始日志转化为目标格式。
采集通道：采集通道等价于Logstash的pipeline，在Logstash可以配置多个pipeline，每个pipeline包括input、filter、output部分，每个pipeline为单独的作业，互不影响。在安全云脑租户采集上，可将相同的pipeline部署在多个节点上，并且配置相同的pipeline视为一个采集通道。

采集管理中，选作为节点的云服务器规格说明如下表所示：

表2 采集器规格
CPU内核数	内存大小	系统盘	数据盘	参考处理能力
4U	8GB	50GB	100GB	2000 EPS @ 1KB 4000 EPS @ 500B
8U	16GB	50GB	100GB	5000 EPS @ 1KB 10000 EPS @ 500B
16U	32GB	50GB	100GB	10000 EPS @ 1KB 20000 EPS @ 500B
32U	64GB	50GB	100GB	20000 EPS @ 1KB 40000 EPS @ 500B
64U	128GB	50GB	100GB	40000 EPS @ 1KB 80000 EPS @ 500B
说明：云服务器规格最少为2U4G，目录磁盘至少挂载100G磁盘。日志量应当与机器规格成比例放大，总体来说，建议按表中规格比例进行放大。如果机器压力较大，建议部署多台采集器，通过采集通道来统一管理，分摊单机日志中转压力。安装组件控制器前，建议先挂载磁盘，然后使用分盘脚本对磁盘进行分配，确保目录磁盘下有超过100GB的剩余空间，保证采集器Logstash的正常安装和运行。

采集器支持的日志源数量不受限制，可随云资源配置变化而动态扩展。

父主题： 数据采集

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消