Shell日志分析常用命令和例子

 更新时间:2014年12月01日 09:23:27   投稿:junjie  
这篇文章主要介绍了Shell日志分析常用命令和例子,本文重点在一样实现日志分析命令语句例子上,本文给出了10条常用的分析实例,需要的朋友可以参考下

学会用shell分析日志只要一上午!!!

很多地方分享了日志分析的shell脚本,但是基本没说每个命令符的具体含义,学习成本还是很高,在这里总结下,方便大家快速入门。

1、在Windows下的用户要使用shell命令符的话请先安装cygwin,安装方法自行Google(搜技术问题请使用google,百度搜不到活该)

2、下面粗略介绍下SEO日志分析常用的命令符用法,需要详细了解每个命令符请使用Google。

less 文件名 查看文件内容 按“q” 退出

cat 文件名 打开文件,可以多次打开几个文件 | cat 1.log 2.log |cat *.cat
grep -参数 文件名
-i 不区分大小写
-v 显示不符合条件的所有行
-c 显示符合条件的所有行数(符合条件的数量)

egrep 属于grep的升级版,在正则这一块的支持更完善,使用正则的时候建议使用egrep

head -2 文件名 显示2行
head -100 文件名 | tail -10 >>a.log 提取文件第91-100行数据

wc -参数 文件名 统计文本大小,字符多少,行数
-c 统计文本字节数
-m 统计文本字符数
-l 统计文本有多少行

sort – 参数 文件名 对文件进行排序
-n 对文件按照数字排序
-r 反向排序

uniq -参数 文件名 对文件去重,去重前需要使用排序

sort
-c 显示数据重复的次数

split -参数 文件名 对文件进行切割
-100 (每100行切割成一个文件)
-C 25m/b/k (每25兆/字节/K 分割成一个文件)

| 管道,把上一条命令的结果传输给下一条命令

“>” 和“>> ” 重定向写入文件中 “>”相当于“w”清空并写入 “>>”相当于“a” 追加进文件

 awk -F ‘分割符'  Pattern {action} 文件名 使用指定的字符对每一行数据进行分段,默认是空格(网站日志就是空格分开)
-F后面跟的是分隔符
pattern 就是action执行的条件,这里可以使用正则表达式
$n 即时第几段数据 $0表示整行数据
NF表示当前记录的字段数
$NF 表示最后一个字段
BEGIN和END,这两者都可用于pattern中,提供BEGIN和END的作用是给程序赋予初始状态和在程序结束之后执行一些扫尾的工作

bash shell.sh 运行shell.sh脚本

dos2unix xxoo.sh 将“\r\n”转换成“\n” Windows——>linux (由于Windows和Linux下的换行符不同,所以我们在Windows下面下的代码需要使用dos2unix 转换成Linux下的换行符,否则运行shell脚本会报错)

unix2dos xxoo.sh 将“\n”转换成“\r\n” linux——>Windows
rm xx.txt 删除xx.txt文件

3、一些简单的命令符介绍到这里,需要了解shell,建议大家查看相关的书籍.

下面我们开始使用shell分析日志

1、切割百度的抓取数据(将文件切割出来对专门的爬虫数据进行处理能提高效率)

复制代码 代码如下:

cat log.log |grep -i ‘baiduspider' >baidu.log

2、网站状态码个数查询 
复制代码 代码如下:

awk ‘{print $9}' baidu.log|sort|uniq -c|sort -nr

3、百度总抓取量
复制代码 代码如下:

wc -l baidu.log

4、百度不重复抓取量 
复制代码 代码如下:

awk ‘{print $7}' baidu.log|sort|uniq|wc -l

5、百度平均每次抓取的数据大小(结果是KB)
复制代码 代码如下:

awk ‘{print $10}' baidu.log|awk ‘BEGIN{a=0}{a+=$1}END{ print a/NR/1024}'

6、首页抓取量
复制代码 代码如下:

awk ‘$7~/\.com\/$/' baidu.log|wc -l

7、某目录抓取量
复制代码 代码如下:

grep ‘/news/' baidu.log|wc -l

8、抓取最多的10个页面
复制代码 代码如下:

awk ‘{print $7}' baidu.log|sort|uniq -c|sort -nr|head -10

9、找出抓取的404错误页面
复制代码 代码如下:

awk ‘$9~ /^404$/ {print $7}' baidu.log|sort|uniq|sort -nr

10、找出抓取了多少js文件和文件抓取的次数
复制代码 代码如下:

awk ‘$7~ /.js$/ {print $7}' baidu.log|sort|uniq -c |sort -nr

相关文章

  • Linux全网最全面常用命令整理(附实例)

    Linux全网最全面常用命令整理(附实例)

    这篇文章主要介绍了Linux命令,是目前最全面的集合,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-08-08
  • 在Shell脚本中调用另一个脚本的三种方式讲解

    在Shell脚本中调用另一个脚本的三种方式讲解

    今天小编就为大家分享一篇关于在Shell脚本中调用另一个脚本的三种方式讲解,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-04-04
  • shell编程之实现windows回收站功能分享

    shell编程之实现windows回收站功能分享

    这篇文章主要介绍了使用trash命令替代linux rm命令实现windows回收站的功能,需要的朋友可以参考下
    2014-03-03
  • 一天一个shell命令 linux文本操作系列-diff命令详解

    一天一个shell命令 linux文本操作系列-diff命令详解

    这篇文章主要介绍了一天一个shell命令 linux文本操作系列-diff命令详解,需要的朋友可以参考下
    2016-06-06
  • 如何实现ls命令在Win7下正常运行

    如何实现ls命令在Win7下正常运行

    ls命令是Linux系统下最常用的命令之一,使用ls指令可列出目录中的内容,包括文件和子目录的名称,下面通过本文给大家分享如何实现ls命令在Win7下正常运行,需要的朋友参考下吧
    2018-03-03
  • Shell脚本实现服务器多台免密登录操作

    Shell脚本实现服务器多台免密登录操作

    本文介绍了auto_ssh_batch.sh脚本,用于在多台RHEL/CentOS7主机之间快速配置SSH免密登录,并支持远程传输脚本/文件及执行命令,脚本通过pass文件提供统一认证凭据,nodes文件定义目标主机列表,实现批量自动化操作,感兴趣的朋友一起看看吧
    2025-03-03
  • shell 基本计算、逻辑运算、位运算详解

    shell 基本计算、逻辑运算、位运算详解

    Shell 提供大量的基本运算操作,在脚本中非常有用。Shell 对您提供的算术表达式求值,执行运算展开式,此时使用得出的结果替换表达式
    2012-09-09
  • linux 比较两个文件夹diff不同 (diff命令, md5列表)

    linux 比较两个文件夹diff不同 (diff命令, md5列表)

    这篇文章主要介绍了linux 比较两个文件夹diff不同 (diff命令, md5列表),比较文件夹diff,可以直接使用diff命令,也可以比较文件md5列表,下面通过实例给大家介绍下,感兴趣的朋友跟随脚本之家小编一起学习吧
    2018-05-05
  • 详解shell 变量

    详解shell 变量

    这篇文章主要介绍了shell 变量的相关资料,帮助大家更好的理解和学习shell,感兴趣的朋友可以了解下
    2020-08-08
  • 详解Linux中vi命令大全

    详解Linux中vi命令大全

    vi编辑器是所有Unix及Linux系统下标准的编辑器,它的强大不逊色于任何最新的文本编辑器,本文简单给大家介绍linux中vi命令大全,感兴趣的朋友一起学习吧
    2015-12-12

最新评论