Linux统计某个字符串出现次数并排序的实现步骤

 更新时间:2024年07月23日 08:52:05   作者:smileNicky  
最近遇到一个流量异常调用的接口,所以需要通过后台日志查看接口调用情况,先统计今天内接口的调用次数,再具体到对应的设备号,所以本文给大家介绍了Linux统计某个字符串出现次数并排序的实现步骤,需要的朋友可以参考下

业务场景

最近遇到一个流量异常调用的接口,所以需要通过后台日志查看接口调用情况,先统计今天内接口的调用次数,再具体到对应的设备号,就知道哪台设备有问题了,初步想到wc和awk命令来筛选统计,但是真正去写的时候,发现很多写法都不太记得了,所以花了点时间去查手册,找资料,现在整理成博客,方便以后需要就马上统计出来,也分享出来,希望可以帮助需要的人

项目环境

  • JDK1.8.0_111-b14
  • Linux3.10.0-1062.el7.x86_64
  • Apache Tomcat/8.5.85

实验步骤

统计某个接口调用次数,可以通过grep筛选出对应得到接口,然后加上wc统计出调用次数

cat catalina.out.2024-03-26| grep "/api/get"| wc -l

如果要统计这个接口具体是哪个设备调用的,每个设备具体的调用次数,就稍微有点麻烦,因为接口请求后,会有一个请求参数,一般是json传参的,所以思路是先用grep定位到具体的接口,然后解析传参json字符串,获取设备号code,对应的值value,然后使用uniq加上sort统计出这个设备调用的次数,具体的linux命令是:

cat catalina.out.2024-03-26| grep "/api/get"| awk -F "[,:}]" '{for(i=1;i<=NF;i++){if($i~"code"){print $(i+1)} }}' | tr -d '"'| sort | uniq -c | sort -nr

不熟悉的读者看起来有点懵,所以,一点点分析一下,为什么这样写?

  • 查看日志
    因为是tomcat部署的后端服务,所以要查看tomcat的catalina.out日志文件,使用cat命令
cat catalina.out.2024-03-26
  • 筛选出具体的api接口
cat catalina.out.2024-03-26| grep "/api/get"
  • 筛选请求json字符串对应设备号的value值
    首选,我们请求参数是一串json字符串,假如是这样的:
{ "code", "0B403940FF289695FC093BF2556FFD75", "type":1}

所以需要获取json对应key,也就是我们的设备号code,对应的值0B403940FF289695FC093BF2556FFD75

cat catalina.out.2024-03-26| grep "/api/get" | awk -F "[,:}]" '{for(i=1;i<=NF;i++){if($i~"code"){print $(i+1)} }}'

解释一下awk对应参数

  1. awk -F "[,:}]" :按照中括号中的内容,}:依次分割字符串
  2. {for(i=1;i<=NF;i++){if($i~"code"){print $(i+1)} }}:遍历筛选出来的数据,匹配到code打印出对应的value

通过上面的linux命令,打印出来的是

"0B403940FF289695FC093BF2556FFD75"
"0B403940FF289695FC093BF2556FFD76"
....

如果觉得比较别扭,可以去掉"字符,使用命令

tr -d '"'

打印:

0B403940FF289695FC093BF2556FFD75
0B403940FF289695FC093BF2556FFD76
....
  • 统计字符串出现的次数
    统计字符串重复次数,可以使用uniq -c,然后为什么还要在前面加上sort命令?因为uniq这个命令只能统计连续的的重复行。所以需要结合sort命令使用,先sort排序,然后uniq统计重复的行
sort | uniq -c

打印,可以看出可以统计数量了,但是,没排序

1000 0B403940FF289695FC093BF2556FFD75
1001 0B403940FF289695FC093BF2556FFD76
999 0B403940FF289695FC093BF2556FFD77
....
  • 按照调用次数进行倒序
    sort命令的-n表示按照数值排序,-r表示按照数值降序排序,所以需要加上排序命令
sort -nr
999 0B403940FF289695FC093BF2556FFD77
1000 0B403940FF289695FC093BF2556FFD75
1001 0B403940FF289695FC093BF2556FFD76

....

总结归纳

如果遇到param=0b33131等等这样传参的可以使用如下命令进行筛选,意思是使用param=作为分隔符

 awk -F '(param=)' '{print $2}'

如果遇到和本文类似的场景,直接使用命令进行统计即可:

cat catalina.out.2024-03-26| grep "/api/get"| awk -F "[,:}]" '{for(i=1;i<=NF;i++){if($i~"code"){print $(i+1)} }}' | tr -d '"'| sort | uniq -c | sort -nr

到此这篇关于Linux统计某个字符串出现次数并排序的实现步骤的文章就介绍到这了,更多相关Linux统计字符串出现次数并排序内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Linux下强制杀死进程的方法详解

    Linux下强制杀死进程的方法详解

    这篇文章中我们给大家分享了关于Linux下强制杀死进程的方法技巧相关内容,有兴趣的朋友们可以参考了下。
    2018-09-09
  • Apache、Nginx下Font Awesome在 Firefox 中不显示问题解决方法

    Apache、Nginx下Font Awesome在 Firefox 中不显示问题解决方法

    这篇文章主要介绍了Apache、Nginx下Font Awesome在 Firefox 中不显示问题解决方法,在配置中增加一个响应头即可解决这个问题,需要的朋友可以参考下
    2014-07-07
  • centos8自定义目录安装nginx(教程详解)

    centos8自定义目录安装nginx(教程详解)

    这篇文章主要介绍了centos8自定义目录安装nginx的详细教程,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-11-11
  • Polysh命令实现多日志查询的方法示例

    Polysh命令实现多日志查询的方法示例

    大家应该都知道Polysh是一个交互式命令,可以在一台服务器上批量的对一批服务器进行处理,运行交互式命令。下面这篇文章主要给大家介绍了关于利用Polysh命令实现多日志查询的相关资料,需要的朋友可以参考,下面来一起看看吧。
    2017-12-12
  • 详解linux SSH登录流程

    详解linux SSH登录流程

    本篇文章通过秘匙生成等问题详细分析了linux里SSH登录流程,有需要的朋友参考一下吧。
    2017-12-12
  • linux如何开启apache服务

    linux如何开启apache服务

    这篇文章主要介绍了linux如何开启apache服务,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-11-11
  • Ubuntu系统安装Ruby的三种方法

    Ubuntu系统安装Ruby的三种方法

    Ruby是一个开源的动态编程语言,本篇文章主要介绍了Ubuntu系统安装Ruby的三种方法,有兴趣的可以了解一下。
    2016-11-11
  • ubuntu系统中/etc/rc.local和/etc/init.d/rc.local的区别详解

    ubuntu系统中/etc/rc.local和/etc/init.d/rc.local的区别详解

    这篇文章主要给大家介绍了关于在ubuntu系统下/etc/rc.local和/etc/init.d/rc.local区别的相关资料,文中通过示例代码介绍的非常详细,对需要的朋友们具有一定的参考学习价值,需要的朋友们下面来一起看看吧。
    2017-08-08
  • htaccess Rewrite中文编码问题解决方法

    htaccess Rewrite中文编码问题解决方法

    Seo方面对于中文地址或则文件名,在Google好像比重要大一些,今天正好看到andy的文章.转下,以后也许会用.
    2008-10-10
  • Linux实现科学上网

    Linux实现科学上网

    本文给大家介绍的是Linux下使用plink ssh + privoxy 实现局域网共享代理,非常的全面细致,这里推荐给大家。
    2015-03-03

最新评论