阿里云日志服务日志过滤器配置

 更新时间:2022年04月08日 17:19:03   作者:Oops!  
这篇文章主要介绍了阿里云日志服务日志过滤器配置 ,需要的朋友可以参考下

日志收集流程

对于日志收集的客户端,其work pipeline通常包括三个过程:Input,Process,Output。

  • Input: 适配各类日志接入源,目前Logtail支持文本文件、Syslog(TCP流式)两种形式数据写入。
  • Process:自定义日志处理逻辑,常见的有:日志切分、日志编码转换、日志结构化解析、日志过滤等等。
  • Output:定义日志输出,例如Logtail以HTTP协议写数据到日志服务。

今天要介绍Logtail在日志处理阶段的两个新功能:转码、过滤

日志转码

日志服务限制数据的字符编码为UTF-8,这也是Logtail在发送数据阶段对于字符编码的要求。

但可能一些较老的应用组件在处理中文的时候,会打印GBK编码的数据到日志文件。

这种情况下,你可以在Logtail配置的高级选项中,选择日志文件编码为”GBK“。那么,Logtail在采集日志时,会对日志内容先做GBK到UTF-8的编码转换,再进行后续处理。

Logtail目前支可以支持UTF-8和GBK两种文件编码格式。对于GBK格式,Logtail使用Linux系统的iconv API,编码转换过程中会额外消耗机器计算资源。

问:如何判断我的GBK日志文件是否可以通过Logtail收集?
答:在Linux Shell下使用iconv命令进行转码测试,假设日志文件名为gbk.log,执行命令:

iconv -f GBK -t UTF-8 gbk.log -o gbk_to_utf8.log

如果执行成功则说明文件编码是GBK;如执行失败(类似iconv: illegal input sequence at position 2743错误),则说明文件不是合法的GBK编码,无法通过Logtail做编码转换,请尝试调整应用输出的日志文件编码格式为UTF-8。

日志过滤

举一个web服务器的例子,Nginx每时每刻接收大量请求,并在access.log记录这些请求:

10.200.98.220 - - [25/May/2016:14:55:42 +0800] "HEAD sls-pub.alibaba-inc.com/projects/ali-cn-hangzhou-sls-admin/logstores HTTP/1.1" 0.024 18204 200 37 "-" "aliyun-sdk-java" 13605
10.200.98.220 - - [25/May/2016:14:55:42 +0800] "POST sls-pub.alibaba-inc.com/projects/ali-cn-hangzhou-sls-admin/logstores HTTP/1.1" 0.024 18204 404 37 "-" "ali-log-logtail" 13608
10.200.98.220 - - [25/May/2016:14:55:42 +0800] "PUT sls-pub.alibaba-inc.com/projects/ali-cn-hangzhou-sls-admin/logstores HTTP/1.1" 0.024 18204 401 37 "-" "aliyun-sdk-java" 13609
10.200.98.220 - - [25/May/2016:14:55:42 +0800] "PUT sls-pub.alibaba-inc.com/projects/ali-cn-hangzhou-sls-admin/logstores HTTP/1.1" 0.024 18204 502 37 "-" "aliyun-sdk-java" 13610
10.200.98.220 - - [25/May/2016:14:55:42 +0800] "GET sls-pub.alibaba-inc.com/projects/ali-cn-hangzhou-sls-admin/logstores HTTP/1.1" 0.024 18204 401 37 "-" "cpp-sdk-0.6" 13612
10.200.98.220 - - [25/May/2016:14:55:42 +0800] "PUT sls-pub.alibaba-inc.com/projects/ali-cn-hangzhou-sls-admin/logstores HTTP/1.1" 0.024 18204 400 37 "-" "cpp-sdk-0.6" 13614
10.200.98.220 - - [25/May/2016:14:55:42 +0800] "POST sls-pub.alibaba-inc.com/projects/ali-cn-hangzhou-sls-admin/logstores HTTP/1.1" 0.024 18204 400 37 "-" "ali-log-logtail" 13615
10.200.98.220 - - [25/May/2016:14:55:42 +0800] "HEAD sls-pub.alibaba-inc.com/projects/ali-cn-hangzhou-sls-admin/logstores HTTP/1.1" 0.024 18204 200 37 "-" "cpp-sdk-0.6" 13616

对于问题调查的场景,HTTP 200请求的日志量通常是巨大的,如果我们希望降低日志存储的成本,只上传发生异常的请求日志,应该怎么来做呢?

在今天,你可以打开Logtail配置的高级选项,设置过滤器来解决数据过滤的问题。

logtail_

如上图所示,分别对url字段和status字段设置了两个过滤器。指定字段Key存在且Value符合正则表达式的日志会被保留。

定义多个过滤器的时候,判断条件是“与”的关系,满足所有过滤器设置的日志是合法的,否则被丢弃。

对于一条日志,当url字段与"(POSTs.)|(GETs.)"匹配成功且status字段与"[345]d+"匹配成功的时候(只采集POST、GET请求且状态码非200的日志),Logtail将该日志上传至日志服务,如下图所示:

_

如果设置过滤器的字段名在日志里找不到,那么这条日志也是不合法的,需要被丢弃。默认情况下,用户没有任何过滤器设置的情况下,所有被Logtail读取并解析成功的日志数据都会写入日志服务。

实例配置:

只收集匹配到 topic  为  action 或者 plugin 的日志 

更多关于阿里云日志服务日志过滤器配置技术文章请查看下面的相关链接

相关文章

  • DELL DOSA 6.X 服务器引导光盘Dell Systems Build and Update Utility ISO下载地址

    DELL DOSA 6.X 服务器引导光盘Dell Systems Build and Update Utility I

    戴尔系统构建和更新实用程序是可引导的实用程序,适用于单一服务器操作系统安装、预加载操作系统固件更新和预加载操作系统系统配置
    2016-04-04
  • 服务器做raid1问题集锦

    服务器做raid1问题集锦

    这篇文章主要是因为最近的服务器为了安全性考虑了做了raid1,但怕硬盘出问题,特整理了这篇文章,并根据自己的经验结合了下,希望能帮到需要的朋友
    2013-06-06
  • 阿里云快速搭建一个静态网站的方法步骤

    阿里云快速搭建一个静态网站的方法步骤

    这篇文章主要介绍了阿里云快速搭建一个静态网站的方法步骤,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-02-02
  • cwRsync 错误 uid/gid 4294967295 (-1) is impossible to set on

    cwRsync 错误 uid/gid 4294967295 (-1) is impossible to set on

    今天在同步文件的时候,因为用了4.3的新版本,出现了这个问题,cwRsync 错误 uid/gid 4294967295 (-1) is impossible to set on,后来参考下面的方法解决了,特分享一下方便需要的朋友
    2016-08-08
  • 大数据平台使用搭建脚本一键安装OS

    大数据平台使用搭建脚本一键安装OS

    本文给大家分享的是如何在大数据平台使用脚本来实现一键安装定制OS,并给大家附上了脚本源码,有需要的小伙伴可以参考下
    2018-03-03
  • Zookeeper未授权访问测试问题

    Zookeeper未授权访问测试问题

    ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。这篇文章主要介绍了Zookeeper未授权访问测试,需要的朋友可以参考下
    2019-10-10
  • 云服务器宝塔面板的安装图文教程详解

    云服务器宝塔面板的安装图文教程详解

    这篇文章主要介绍了云服务器宝塔面板的安装教程,本文图文并茂给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • imail8.22安装激活实例[图文]

    imail8.22安装激活实例[图文]

    今天制作此实例的目的是因为前几天我提供了IMAIL8.22中文模板和算号器,这几天问我怎么注册的人还挺多,一句话又讲不清,不讲吧,又觉得对不起朋友们,所以花了点时间,做了此实例,方便朋友们使用,高手就不用看了
    2011-09-09
  • Tornado Web服务器中处理空白字符的解决方案

    Tornado Web服务器中处理空白字符的解决方案

    这篇文章主要介绍了Tornado Web服务器中处理空白字符的解决方案,本文通过修改Tornado源码解决这个问题,需要的朋友可以参考下
    2015-01-01
  • HP服务器RAID 0阵列配置教程

    HP服务器RAID 0阵列配置教程

    这篇文章主要介绍了HP服务器RAID 0阵列配置教程,需要的朋友可以参考下
    2016-04-04

最新评论