管理OpenSearch集群日志
CSS服务通过日志查询、日志备份和日志采集三大核心功能,为用户提供全面的日志管理能力,满足不同场景下的日志处理需求,帮助用户高效定位问题、优化性能及保障系统安全。
- 日志查询:在云搜索服务管理控制台的日志管理页面,用户可按节点、日志类型等条件筛选最近日志,并查看结果,适用于快速定位突发问题。
- 日志备份:通过定期将集群日志同步至OBS桶,用户可随时下载日志文件进行深度分析。该功能支持自定义备份策略(如备份时间、存储路径等),备份日志包含运行日志、慢查询日志、弃用操作日志等类型,满足不同场景的审计与排查需求。
- 日志采集:实时将集群日志传输至当前集群或同网络的其他集群(需满足版本及网络兼容性要求),通过OpenSearch Dashboards或其他工具实现日志的可视化搜索与分析。用户可设置索引前缀、保留周期等,灵活管理日志生命周期。采集日志支持跨集群分发,便于多集群环境下的集中监控。
计费影响
当使用日志备份功能时,备份的日志存储在OBS桶中需要额外收费,具体收费说明请参见对象存储服务计费说明。
前提条件
当使用日志备份功能时,需要提前创建用于存储日志的OBS桶。OBS桶需要满足如下条件:
- “存储类别”为“标准存储”。
- “区域”须与集群所在区域相同。
查询日志
- 登录云搜索服务管理控制台。
- 在左侧导航栏,选择“集群管理 > OpenSearch”。
- 在集群列表,单击目标集群名称,进入集群详情页。
- 选择“日志管理 > 日志查询”,进入日志查询页面。
通过选择日志类型、节点、日志级别或关键字查询日志,各类日志的详细说明请参见日志介绍。
当日志文件大小达到128MB或每日零点(00:00 UTC)时,系统将自动将其打包为压缩包并归档。日志查询界面仅展示未归档的日志内容。已归档的日志需通过日志备份功能获取。
备份日志
日志备份可以将集群日志同步至OBS桶,支持随时下载日志文件进行深度分析。
- 登录云搜索服务管理控制台。
- 在左侧导航栏,选择“集群管理 > OpenSearch”。
- 在集群列表,单击目标集群名称,进入集群详情页。
- 选择“日志管理 > 日志备份”,进入日志备份页面。
- 启用日志备份功能。
- 备份日志。支持自动备份日志和手动备份日志两种方式。
- 查看备份的日志文件。
日志备份采用增量备份方式,备份成功后可以单击“备份路径”访问OBS桶获取全量日志文件。
图3 访问OBS桶日志文件类型如表3所示,其中“clustername”是集群名称。
- 当不再使用日志备份功能时,支持关闭备份。
在日志备份页面,单击“关闭备份”,在弹框中单击“确定”即可关闭日志备份功能。关闭后,备份的日志数据不会自动清理,需前往OBS控制台手动清理。
采集日志
日志采集可以实时将集群日志传输至当前集群或同网络的其他集群,方便通过OpenSearch Dashboards进行日志搜索分析。
仅当OpenSearch集群版本号为1.3.6或2.19.0,且镜像版本号不低于x.x.x_24.2.0_x.x.x时,才支持日志采集功能。
- 登录云搜索服务管理控制台。
- 在左侧导航栏,选择“集群管理 > OpenSearch”。
- 在集群列表,单击目标集群名称,进入集群详情页。
- 选择“日志管理 > 日志采集”,进入日志采集页面。
如果没有“日志采集”页签,则表示该集群不支持采集日志。
- 启用日志采集功能。如果已开启则跳过该步骤。
- 单击“开启日志采集”,在开启日志采集对话框中完成日志采集配置。
表4 日志采集配置说明 参数
说明
索引前缀名称
设置采集的日志中索引名称的前缀,设置后采集的日志索引名称为“索引前缀名称+日志采集日期”,日志采集日期以天为单位。
索引前缀名称只支持数字、小写字母、下划线和中划线,支持1~128个字符。
保留周期
设置采集的日志的保留周期。当采集的日志超过保存周期时,日志将会被删除。
取值范围:1~3650
单位:天
日志保存集群
设置采集的日志保存在哪个集群,支持选择“当前集群”和“其他集群”。
- 配置完成后,单击“确定”,启用日志采集功能。
此时,日志采集页面会显示配置信息。
- 单击“开启日志采集”,在开启日志采集对话框中完成日志采集配置。
- 查看采集的日志。
图4 查看采集的日志
- 单击“访问Dashboards”,可用直接登录目标集群,搜索查看日志。
- 单击“日志保存集群”的集群名称,可以跳转到目标集群详情页面。
- 当不再使用日志采集功能时,支持关闭日志采集,释放存储资源。
在日志采集页面,单击“关闭日志采集”,在弹框中单击“确定”即可停止日志采集任务。关闭后,已采集的日志数据不会立即被清空,仅当超过设置的“保存周期”时才会被系统删除,这之前也支持前往目标集群手动删除。
日志介绍
日志类型 |
描述 |
使用场景 |
---|---|---|
运行日志 |
运行日志也称为主日志,记录了集群的运行状态和写入查询的关键信息等。例如,写入相关日志包含创建索引、更新索引mapping和写入队列打满等日志;查询相关日志包含查询队列和查询异常等日志。 |
当需要查看集群中各节点的运行状况及查询写入情况,例如节点之间的连通性、Full GC情况、创建或删除索引情况、集群级别的查询报错等信息时,可查看主日志进行排查。 |
慢索引日志 |
用于记录慢索引请求的日志文件,主要用于记录索引操作(如bulk、index、update、delete)中执行时间较长的操作,帮助您发现性能瓶颈。 |
当业务出现写入耗时久的情况时,可查看慢索引日志进行排查。 |
慢查询日志 |
用于记录慢查询请求的日志文件,主要用于监控和分析执行时间较长的搜索请求。它可以帮助您识别性能瓶颈、优化查询语句、提升系统整体性能。 |
当您的业务出现查询耗时久的情况时,可查看慢查询日志进行排查。 |
废弃操作日志 |
用于记录弃用警告(Deprecation Warnings)的日志文件。它会在您使用了已被弃用但尚未移除的API、配置或功能时,向这个日志中写入警告信息。 |
当需要查看业务有没有使用过期API风险情况时,可查看废弃操作日志进行排查。 |
接入日志 |
用于记录访问集群的请求信息,主要记录请求Path、访问地址等信息。 接入日志不支持控制台查看,但可以备份到OBS桶或采集到集群中查看。 |
当业务出现大量的请求,需要定位请求来源和请求路径时,可查看接入日志查看集群访问信息。 |
- 运行日志说明
运行日志记录了集群的运行状态和写入查询的关键信息等。例如下面的日志,表示创建了一个名为test的索引,创建完后集群状态由YELLOW变成GREEN。
图5 运行日志日志内容说明:- 1:日志产生时间。
- 2:日志级别。包括DEBUG、INFO、WARM、ERROR等。
- 3:生成日志的模块。
- 4:生成日志的节点名称。
- 5:日志的主要内容。
- 慢索引日志说明
慢索引日志记录了记录索引操作中执行时间较长的操作。例如下面的日志,展示了索引请求耗时超过设定阈值的请求记录,包括了索引名称、耗时、请求内容等。
图6 慢索引日志 - 慢查询日志
慢查询日志记录了执行时间较长的搜索请求。例如下面的日志,展示了查询请求耗时超过设定阈值的请求记录,包括了索引名称、耗时、请求内容等。
图7 慢查询日志日志内容说明:- 1:日志产生时间。
- 2:日志级别。包括DEBUG、INFO、WARM、ERROR等。
- 3:生成日志的模块。
- 4:生成日志的节点名称。
- 5:索引名称和分片ID。
- 6:日志的主要内容。此示例记录了执行耗时、查询命中数量、查询请求体等信息。
- 废弃操作日志
废弃操作日志记录了弃用警告信息。例如下面的日志,表示GET /_cat/master已经废弃,请使用GET /_cat/cluster_manager替代。
图8 废弃操作日志日志内容说明:- 1:日志产生时间。
- 2:日志级别。只有DEPRECATION。
- 3:生成日志的模块。
- 4:生成日志的节点名称。
- 5:日志的主要内容。
- 接入日志
接入日志记录了访问集群的请求和地址信息,例如下面的日志表示执行了/_snapshot/my_backup/my_snapshot/_restore?pretty=true操作的信息。
图9 接入日志日志内容说明:- 1:日志产生时间。
- 2:日志发生的节点名称。
- 3:生成日志的线程名称。
- 4:日志级别,包括DEBUG、INFO、WARM、ERROR等。
- 5:日志的请求方法。
- 6: 发送的请求路径。
- 7:发送请求的源和目标地址。