详解Linux中的awk命令

 更新时间:2019年11月18日 10:12:53   作者:象在舞  
awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。这篇文章主要介绍了Linux中的awk命令的相关知识,需要的朋友可以参考下

简介

awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。

awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。

awk其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母。实际上 AWK 的确拥有自己的语言: AWK 程序设计语言 , 三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。

一、选项参数说明

awk是一种处理文本文件的语言,我们可以使用awk --help查看一下它的选项参数,如下:

二、基本用法

1、行匹配语句,此处awk后只能跟单引号,格式如下:

awk '{匹配的内容}' 匹配的文件名称

例如:

现有如下测试文件test:

使用如下命令输出文中每行的1、4项内容:

awk '{print $1,$4}' test

也可以添加如下内容使其格式化输出:

awk '{printf "%-8s %-10s\n",$1,$4}' test 

2、指定分隔符

awk '{printf "%-8s %-10s\n",$1,$4}' test 

例如:

有如下test文件:

执行如下命令,使用逗号分割输出每行的第一、二项内容:

awk -F, '{print $1,$2}' test

也可以使用内建变量,格式如下:

 awk 'BEGIN{FS=","} {print $1,$2}' test

对于使用多个分隔符,首先使用空格分割,然后再使用其他分割符进行分割:

awk -F '[ ,]' '{print $1,$2,$4}' test

3、设置变量

awk -v

例如:

现有如下数据:

执行如下命令,每行第一项加1:

awk -va=1 '{print $1,$1+a}' test

也可以使用如下命令设置多个变量:

awk -va=1 -vb=s '{print $1,$1+a,$1b}' test

4、通过awk脚本来运行awk命令

awk -f awk脚本 文件名

例如:

awk -f file.awk test

三、运算符

例如:

1、过滤第一列大于2的行

awk '$1>2' test

2、过滤等于2的列

awk '$1==2 {print $1,$3}' test

3、过滤第一列大于2并且第二列等于Are的行

awk '$1>2 && $2=="Are" {print $1,$2,$3}' test

四、内建变量

例如:

awk 'BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}' test

awk -F\' 'BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}' test

awk '{print NR,FNR,$1,$2,$3}' test

awk '{print $1,$2,$5}' OFS=" $ " test

五、使用正则,字符串匹配

例如:

1、输出第二列包含“th”并打印第二列与第四列。

awk '$2 ~ /th/ {print $2,$4}' test

~表示模式开始,//中存放匹配的模式。

2、输出包含“re”的行

awk '/re/ ' test

六、忽略大小写

awk 'BEGIN{IGNORECASE=1} /this/' test

七、模式取反

awk '$2 !~ /th/ {print $2,$4}' test

awk '!/th/ {print $2,$4}' test

八、awk脚本

关于awk脚本,需要注意BEGIN和END两个关键词:

(1)BEGIN{存放执行前的语句};

(2)END{存放处理完所有的行后要执行的语句}。

例如:

现有数据如下:

我们的awk脚本内容如下:

执行结果如下:

总结

以上所述是小编给大家介绍的Linux中的awk命令,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

  • Shell交互批量更改主机名的方法

    Shell交互批量更改主机名的方法

    大家可能会遇到这种情况,需要批量修改主机名和同步hosts文件到多台主机,例如新购置了一批云服务器等,可能主机名称上并不能满足你的命名规则或规范,但如果一台台去更改可能就太慢又无聊,所以shell脚本绝对是你的最佳选择。下面看看Shell批量更改主机名的方法。
    2016-12-12
  • Linux shell 实现用for循环100次的方法

    Linux shell 实现用for循环100次的方法

    今天小编就为大家分享一篇Linux shell 实现用for循环100次的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Vim 编辑器操作汇总

    Vim 编辑器操作汇总

    本文是小编给大家收藏整理的关于vim编辑器操作方法,非常不错,具有参考借鉴价值,需要的朋友参考下吧
    2018-05-05
  • Shell中使用plink工具实现远程批量关机

    Shell中使用plink工具实现远程批量关机

    这篇文章主要介绍了Shell中使用plink工具实现远程批量关机,Plink 是命令行工具,执行远程服务器上的命令,需要的朋友可以参考下
    2014-12-12
  • linux 中的gzip命令

    linux 中的gzip命令

    gzip是在Linux系统中经常使用的一个对文件进行压缩和解压缩的命令,既方便又好用。接下来通过本文给大家分享linux 中的gzip命令,感兴趣的朋友一起看看吧
    2017-09-09
  • gearman队列持久化引发的问题及解决方法

    gearman队列持久化引发的问题及解决方法

    这篇文章主要介绍了gearman队列持久化引发的问题及解决方法,需要的朋友可以参考下
    2014-07-07
  • Shell(())实现对整数进行数学运算

    Shell(())实现对整数进行数学运算

    这篇文章主要介绍了Shell(())实现对整数进行数学运算,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • linux下监控网络流量的脚本

    linux下监控网络流量的脚本

    在我们的日常工作当中,监控网络要么使用iptarf,ifstat这些命令实现的,但是需要装额外的RPM包。特别是iptarf装起来麻烦
    2013-01-01
  • shell脚本实现监控shell脚本的执行流程及变量的值

    shell脚本实现监控shell脚本的执行流程及变量的值

    这篇文章主要介绍了shell脚本实现监控shell脚本的执行流程及变量的值本文使用shell完成对执行过程中条件语句中的变量的变化的监控和整个程序的执行流程的观察功能,需要的朋友可以参考下
    2015-03-03
  • hbase-shell批量命令执行脚本的方法

    hbase-shell批量命令执行脚本的方法

    今天小编就为大家分享一篇hbase-shell批量命令执行脚本的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06

最新评论