收集数据面日志
费用说明
LTS创建日志组免费,并每月赠送每个账号一定量免费日志采集额度,超过免费额度部分将产生费用。
集群数据面组件说明
当前支持收集以下两种类型的控制面日志,每个日志流对应一个Kubernetes控制层面组件。关于这些组件的更多信息,请参见Kubernetes组件。
类别 |
组件 |
日志流 |
说明 |
---|---|---|---|
数据面组件日志 |
default-stdout |
stdout-{clusterID} |
采集标准输出。默认日志组:k8s-logs-{集群ID}。 |
default-event |
event-{clusterID} |
采集Kubernetes事件。默认日志组:k8s-logs-{集群ID}。 |
使用云原生日志采集插件采集日志
- 查看并配置日志采集策略。
- 登录容器舰队控制台,单击集群名称进入集群,选择左侧导航栏的“日志中心”。
- 右上角单击“日志采集策略”,将显示当前集群所有上报LTS的日志策略。
图1 查看日志策略
若安装插件时勾选了采集标准输出和采集Kubernetes事件,将创建两个日志策略,并对接默认的LTS日志组、日志流。
- 创建日志策略:单击上方“创建日志策略”,输入要采集的配置信息。
策略模板:若安装插件时未勾选需要采集的日志策略,或者删除了对应的日志策略,可通过该方式重新创建默认日志策略。
图2 使用策略模板
自定义策略:用于配置自定义日志策略。
图3 自定义策略
- 编辑日志策略:单击“编辑”按钮,可对已经存在的日志策略进行修改。
- 删除日志策略:单击“删除”按钮,可对已经存在的日志策略进行删除。
- 查看日志。
- 登录容器舰队控制台,单击集群名称进入集群,选择左侧导航栏的“日志中心”。
- 日志中心下有5个页签,支持不同类型日志查看。
- 容器日志:显示默认日志组(k8s-log-{集群ID})下默认日志流(stdout-{集群ID})中的所有日志数据,华为云集群支持通过工作负载搜索。
图4 容器日志查询
- Kubernetes事件:显示默认日志组(k8s-log-{集群ID})下默认日志流(event-{集群ID})中的所有日志数据,用于查询集群产生的Kubernetes事件。
- 控制面组件日志:显示默认日志组(k8s-log-{集群ID})下默认日志流({组件名}-{集群ID})中的所有日志数据,用于查看集群控制面重要组件的日志信息。
- 控制面审计日志:显示默认日志组(k8s-log-{集群ID})下默认日志流audit-{集群ID})中的所有日志数据,用于查看集群控制面审计日志信息。
- 全局日志查询:支持查看所有日志组日志流下的日志信息。可通过选择日志流查看所选日志流中的日志信息,默认会选择集群默认日志组(k8s-log-{集群ID}),可通过单击切换日志组右侧的图标切换其他日志组。
图5 全局日志查询
- 容器日志:显示默认日志组(k8s-log-{集群ID})下默认日志流(stdout-{集群ID})中的所有日志数据,华为云集群支持通过工作负载搜索。
- 单击右上角“日志采集策略”,单击“查看日志”,可以直接跳转至对应日志策略的日志列表。
图6 查看日志
常见问题处理
- log-operator标准输出报错:Failed to create log group, the number of log groups exceeds the quota
示例:
2023/05/05 12:17:20.799 [E] call 3 times failed, resion: create group failed, projectID: xxx, groupName: k8s-log-xxx, err: create groups status code: 400, response: {"error_code":"LTS.0104","error_msg":"Failed to create log group, the number of log groups exceeds the quota"}, url: https://lts.cn-north-4.myhuaweicloud.com/v2/xxx/groups, process will retry after 45s
解决方案:LTS日志组有配额限制,如果出现该报错,请前往LTS下删除部分无用的日志组。限制详情请参见:日志组。
- 配置了容器文件路径采集,采集的目录不是挂载到容器内的,且节点引擎为docker,采集不到日志。
解决方案:
请检查工作负载所在节点的容器存储模式是否为deviceMapper,deviceMapper不支持采集容器内日志(创建日志策略时已提示此限制,如图7所示)。检查方法如下:
- 进入业务工作负载所在节点。
- 执行docker info | grep "Storage Driver"。
- 若返回的Storage Driver值为devicemapper,则该日志无法采集。
- 日志无法上报,otel组件标准输出报错:log's quota has full
解决方案:
云日志服务(LTS)有免费赠送的额度,超出后将收费,报错说明免费额度已用完,如果需要继续使用,请前往云日志服务控制台“配置中心>配额设置”,打开“超额继续采集日志”开关。
- 采集容器内日志,且采集目录配置了通配符,日志无法采集。
排查方法:请检查工作负载配置中Volume挂载情况,如果业务容器的数据目录是通过数据卷(Volume)挂载的,插件不支持采集它的父目录,需设置采集目录为完整的数据目录。例如/var/log/service目录是数据卷挂载的路径,则设置采集目录为/var/log或/var/log/*将采集不到该目录下的日志,需设置采集目录为/var/log/service。
解决方案:若日志生成目录为/application/logs/{应用名}/*.log,建议工作负载挂载Volume时,直接挂载/application/logs,日志策略中配置采集路径为/application/logs/*/*.log