文档首页/ 云日志服务 LTS/ 用户指南/ 日志接入/ 使用云服务接入LTS/ 对象存储服务OBS接入LTS(邀测)
更新时间:2024-12-13 GMT+08:00
分享

对象存储服务OBS接入LTS(邀测)

支持将对象存储服务桶内的文件一次性或定期导入到云日志服务,OBS服务接入LTS成功后,即可对日志进行搜索分析、日志加工等操作。加密桶的文件不支持导入LTS,若需要导入加密桶的文件,请先删除桶的加密配置,详细请参考删除桶的加密配置

该功能仅支持华北-北京四、华南-广州的白名单用户,其他区域暂不支持申请开通。

设置单个对象存储OBS接入LTS

  1. 登录云日志服务控制台
  2. 在左侧导航栏中,选择“接入 > 接入中心”,单击“云服务接入-对象存储OBS”进行OBS接入配置。

    或在左侧导航栏中,选择“接入 > 接入管理 > 接入日志”,单击“云服务接入-对象存储OBS”进行OBS接入配置。

    或在左侧导航栏中,选择“日志管理”,单击目标日志流的名称进入日志详情页面。单击右上角,在弹出页面中,选择“日志接入”页签,单击“接入日志”,在弹出页面中,单击“云服务接入-对象存储OBS”进行OBS接入配置。

  3. 单击“所属日志组”后的目标框,在下拉列表中选择具体的日志组。若没有所需的日志组,单击“所属日志组”目标框后的“新建”,在弹出的创建日志组页面创建新的日志组。详细请参考管理日志组
  4. 单击“所属日志流”后的目标框,在下拉列表中选择具体的日志流。若没有所需的日志流,单击“所属日志流”目标框后的“新建”,在弹出的创建日志流页面创建新的日志流。详细请参考管理日志流
  5. 单击“下一步:采集配置”。
  6. 在采集配置页面,参考表1设置参数。

    表1 采集配置

    参数类型

    名称

    说明

    基本配置

    采集配置名称

    自定义采集配置名称,长度范围为1到64个字符,只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。

    任务监控

    默认开启。

    开启后会将每次任务执行状态写入日志流 lts-system/lts-obs2lts-statistics,您可以查看OBS文件导入LTS任务监控中心或者配置告警规则,及时发现数据导入过程中可能出现的异常问题。

    OBS数据源配置

    OBS桶

    选择需要导入日志文件到LTS的OBS桶。

    文件夹前缀

    输入待导入的OBS文件前缀,用于准确定位待导入的文件,支持输入文件前缀your_prefix/或完整路径your_prefix/file.gz(只支持导入5GB以内的原始文件)。

    文件正则过滤

    用于过滤文件的正则表达式,只有文件名匹配该正则表达式的文件才会被导入。若不填写正则表达式,表示不过滤文件。

    说明:

    假设目录下有aab和aba文件:

    • 只匹配aab文件,正则写法:aab或aa或^aab或者aa.
    • 只匹配aba文件,正则写法:aba或^aba或者^ab,不能写ab因为这样aab也是能匹配上的
    • 匹配aab和aba,正则写法:ab或者a.*
    • 如果存在正则关键字的字符需要转义,例如{}则需要要转义为\{\}

    压缩格式

    支持自动检测、不压缩、压缩gzip、压缩zip、压缩snappy。如果是zip压缩文件,只能包含一个文件,不能有任何文件夹。

    导入间隔

    • 一次性:只导入一次,云日志服务不会检测新出现的文件。
    • 固定间隔:设置固定时间导入文件,云日志服务会检测新出现的文件,并导入云日志服务。

      开启“解冻归档文件”:只支持解冻归档存储类别为归档存储的OBS文件。归档文件需要激活此选项,归档文件激活需要一定时间(归档存储加急需要1~5分钟,详情请参考对象恢复方式及耗时)。首次单击右下角的“预览”可能超时,请再次重试单击“预览”。

      说明:
      • 周期任务首次开始扫描obs上文件,文件的最后修改时间区间范围是(周期首次运行时间-固定间隔时间,周期首次运行时间]。例如周期任务首次开始12:00:00,obs导入任务配置的固定时间间隔为10分钟,那么首次扫描出来的obs文件其最后修改时间在(11:50:00, 12:00:00]区间内,第二次周期12:10:00运行,则扫描出来的文件其最后修改时间在(12:00:00, 12:10:00]区间内。
      • 一次性任务如果处理某个文件失败后,扫描出来的其余文件不会再被解析上报到LTS。
      • 固定间隔任务关闭后重新开启,监控数据连续性最多保持一天。
      • 固定间隔任务在某个周期时间内处理文件失败后,该周期时间内扫描出来的其余文件不会再被解析上报到LTS。

    数据格式配置

    日志文件编码

    日志文件编码支持UTF-8、GBK。

    UTF-8编码是一种变长编码方式,用于表示Unicode字符集。GBK全称《汉字内码扩展规范》,中文计算机编码的一种,是ASCII码和GB2312编码的扩展。

    提取模式

    根据日志类型选择提取模式,提取OBS日志超过1MB的部分会被截断丢弃。

    说明:
    • 单行日志单行超过1MB的部分被截断丢弃。
    • 多行日志多行块超过1MB的部分被截断丢弃。
    • ORC和JSON格式日志是单行解析,如果单行日志超过1MB直接被丢弃。
    • 单行全文:采集完整的单行日志全文,不做结构化解析。如果您需要对日志做结构化解析,请在完成OBS文件导入配置后,请参考设置云端结构化解析日志设置。
    • 多行全文:采集完整的多行日志全文(如堆栈日志),不做结构化解析。如果您需要对日志做结构化解析,请在完成OBS文件导入配置后,请参考设置云端结构化解析日志设置。
    • ORC:采集ORC格式的日志。

      不开启“自定义时间”时,使用日志被采集时间作为日志时间。

      开启“自定义时间”时,可指定某一字段作为日志时间。填写时间字段Key名称、字段Value、时间格式,设置完成后,单击校验。如果导入的数据写入到css集群,LTS不支持ORC格式日志自定义两天前的时间。自定义时间格式请参考Oracle官网的时间匹配字符

    • JSON:采集JSON格式的日志。

      不开启“自定义时间”时,使用日志被采集时间作为日志时间。

      开启“自定义时间”时,可指定某一字段作为日志时间。填写时间字段Key名称、字段Value、时间格式,设置完成后,单击校验。如果导入的数据写入到css集群,LTS不支持JSON格式日志自定义两天前的时间。自定义时间格式请参考Oracle官网的时间匹配字符

      设置json解析层数,取值范围为1~4,只能整数,默认值为1。将json格式日志的字段展开,例如原始日志为{"key1":{"key2":"value"}},解析1层日志为:{"key1":{"key2":"value"}},解析2层日志为:{"key1.key2":"value"}。

  7. 设置完成后,单击右下角的“预览”。预览只扫描并返回符合条件的第一个文件的前10行内容。
  8. 在结果预览下方查看结果,确认无误后,单击“提交”。
  9. 接入成功后,在接入规则页签,则会生成一条接入配置信息。邀测期间,最多支持创建10个接入任务。

    • 单击接入配置名称可进入详情页面,查看该接入配置详细信息。
    • 单击接入配置操作列的“修改”重新修改接入配置信息。不支持修改导入间隔为一次性的任务。
    • 单击接入配置操作列的“标签管理”即可添加标签。
    • 单击接入配置操作列的“复制”复制一条新的接入配置信息。
    • 单击接入配置操作列的“删除”即可删除接入配置信息。

      删除接入配置后会导致日志无法正常采集,可能会影响用户日志相关业务异常,且删除后无法恢复,请谨慎操作。

    • 单击所属日志流的名称进入日志流详情页,即可对接入LTS的日志进行日志搜索分析。详细请参考日志搜索与分析(默认推荐)

相关文档