Bash中使用正则表达式进行文本处理指南

 更新时间:2026年01月06日 10:58:29   作者:gis分享者  
正则表达式是文本处理的瑞士军刀,它们以紧凑的模式匹配功能广泛应用于网络安全领域,这篇文章主要介绍了Bash中使用正则表达式进行文本处理的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下

前言

在 Bash 脚本中,可以使用正则表达式来进行文本处理,最常用的工具是 grep、sed 和 awk。

1.1 示例

举个简单的例子,假设你有一个文本文件 example.txt,你想查找包含特定模式的行。

你可以使用 grep:

grep 'pattern' example.txt

如果你想对文本进行替换,可以用 sed:

sed 's/old_pattern/new_pattern/g' example.txt

对于更复杂的文本处理,例如统计、格式化,你可以用 awk:

awk '/pattern/ {print $0}' example.txt

1.2 知识扩展

1)grep:

grep 是最基础的文本搜索工具,它支持基本和扩展的正则表达式。

例子:

  • 查找包含数字的行: grep ‘[0-9]’ example.txt
  • 忽略大小写查找:grep -i ‘pattern’ example.txt
  • 查找并显示行号:grep -n ‘pattern’ example.txt
  • 递归查找:grep -r ‘pattern’ /path/to/directory

2)sed:

sed 是一个流编辑器,用于对文本进行筛选和替换。

例子:

  • 替换文件中第一次出现的匹配:sed ‘s/pattern/replacement/’ example.txt
  • 替换整个文件中的所有匹配:sed ‘s/pattern/replacement/g’ example.txt
  • 删除包含特定模式的行:sed ‘/pattern/d’ example.txt
  • 在特定模式后添加文本:sed ‘/pattern/a\new text’ example.txt

3)awk:

awk 是一个强大的文本处理工具,适用于格式化报告和统计分析。

例子:

  • 查找并打印匹配的行:awk ‘/pattern/ {print $0}’ example.txt
  • 分隔特定字段并打印:awk -F: ‘{print $1}’ example.txt(假设文件以冒号分隔)
  • 统计出现次数:awk ‘/pattern/ {count++} END {print count}’ example.txt

进阶内容

1)复杂模式匹配

使用扩展正则表达式:通过添加 -E 参数,你可以让 grep 使用扩展正则:grep -E ‘pattern1|pattern2’ example.txt。
同理,你也可以在 sed 中使用扩展正则:sed -E ‘s/old_pattern(new_pattern)/replacement/g’ example.txt

2)结合工具使用

你可以将这几个工具组合使用,以实现更复杂的文本处理任务。例如,先用 grep 筛选,再用 awk 处理:

grep 'pattern' example.txt | awk '{print $1}'

1.3 实践指南

一、核心处理方式

  1. 原生Bash正则匹配
if [[ "string" =~ ^regex_pattern$ ]]; then
    echo "匹配成功"
    echo "捕获组:${BASH_REMATCH[1]}"
fi
  1. 高级参数扩展
var="2024-07-25_log.txt"
echo ${var//[^0-9]/}       # 删除非数字字符 → 20240725
echo ${var/#*_/}           # 去除前缀保留文件名 → log.txt

二、常用工具链

工具能力范围典型用例
grep模式搜索过滤`grep -E 'error
sed流式编辑替换sed -E ‘s/(\d{4})-(\d{2})/\2/\1/g’
awk结构化字段处理awk ‘/GET/ && $9==200 {print $7}’ log
perlPCRE高级正则perl -pe ‘s/\b\d+\b/NUM/g’

三、正则表达式类型

# 基础正则(BRE)
grep '^From: .*@ctc.com$' emails.txt

# 扩展正则(ERE)
grep -E '[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z]{2,4}' contacts.txt

# Perl兼容正则(PCRE)
grep -P '\d{4}-\d{2}-\d{2}T\d{2}:\d{2}Z' timestamps.log

四、实战案例

  1. 日志分析
# 提取HTTP状态码非200的请求
tail -f access.log | awk 'match($0, /HTTP\/1\.1" ([0-9]{3})/, arr) && arr[1] != 200'
  1. 数据清洗
# 标准化电话号码格式
sed -E 's/(\+86)?[ ]*([0-9]{3})-?([0-9]{4})-?([0-9]{4})/\1 \2-\3-\4/' contacts.csv
  1. 安全检测
# 检测SQL注入特征
grep -P '(union\s+select|sleep\(\d+\)|benchmark\(|\b(and|or)\b.+=[^'"'"']*["'"'"]\s*["'"'"])' web_logs

五、性能优化建议

  1. 优先使用原生Bash操作避免子进程开销
  2. 复杂匹配使用预编译正则(如awk/perl)
  3. 大文件处理时结合LC_ALL=C提升ASCII处理速度
  4. 避免贪婪匹配.*改用精准限定符

六、调试技巧

# 可视化匹配过程
grep --color=auto -nE 'pattern' file

# 测试正则表达式
pcre2test  # 专用测试工具

总结 

到此这篇关于Bash中使用正则表达式进行文本处理的文章就介绍到这了,更多相关Bash正则表达式文本处理内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • shell中数组的定义及操作

    shell中数组的定义及操作

    本文主要介绍了shell中数组的定义及操作,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-05-05
  • CentOS中使用Shell脚本实现每天自动备份网站文件和数据库并上传到FTP中

    CentOS中使用Shell脚本实现每天自动备份网站文件和数据库并上传到FTP中

    这篇文章主要介绍了CentOS中使用Shell脚本实现每天自动备份网站文件和数据库并上传到FTP中,本文脚本比较实用,其它Linux系统也可参考,需要的朋友可以参考下
    2014-12-12
  • 详解Linux常用的四种压缩命令

    详解Linux常用的四种压缩命令

    这篇文章主要详细介绍了Linux常用的四种压缩命令,tar命令,gzip命令,rar命令和zip命令,并通过代码示例给大家讲解的非常详细,具有一定的参考价值,需要的朋友可以参考下
    2024-03-03
  • Linux bash删除文件中含“指定内容”的行功能示例

    Linux bash删除文件中含“指定内容”的行功能示例

    这篇文章主要介绍了Linux bash删除文件中含“指定内容”的行功能,结合具体实例形式分析了Linux bash删除文件指定内容的实现原理与相关操作技巧,需要的朋友可以参考下
    2017-06-06
  • Shell脚本批量添加扩展名的两种方法分享

    Shell脚本批量添加扩展名的两种方法分享

    这篇文章主要介绍了Shell脚本批量添加扩展名的两种方法分享,本文讲解了用rename命令修改后缀名、用for、sed和mv修改后缀名、用find和xargs添加后缀名等方法,需要的朋友可以参考下
    2014-11-11
  • 如何查看Linux提供的Shell解析器

    如何查看Linux提供的Shell解析器

    这篇文章主要介绍了查看Linux提供的Shell解析器的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-06-06
  • Shell常用服务器日志分析命令总结

    Shell常用服务器日志分析命令总结

    有时我们需要分析分析自己网站服务器日志,看看网站的访问量。看看有没有黑阔搞破坏!于是收集,整理一些服务器日志分析命令,大家可以试试
    2022-06-06
  • 通过实例深入理解linux shell数组

    通过实例深入理解linux shell数组

    本文为大家介绍linxu shell中数组的相关知识,并举了很多例子供参考,包括数组的复制,计算,删除,替换等,是学习shell 数组的不可多得的好文章
    2013-02-02
  • 详解shell脚本中的case条件语句介绍和使用案例

    详解shell脚本中的case条件语句介绍和使用案例

    这篇文章主要介绍了详解shell脚本中的case条件语句介绍和使用案例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • shell脚本批量执行指定路径下sql脚本的实现

    shell脚本批量执行指定路径下sql脚本的实现

    本文主要介绍了shell脚本批量执行指定路径下sql脚本的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02

最新评论