从入门到精通Shell正则表达式实战

更新时间：2026年03月04日 14:18:31 作者：J超会运

正则表达式是Shell编程中处理文本的核心工具,配合 grep、sed、awk 等工具可实现强大的文本查找、替换、提取功能,本教程从基础到进阶,结合大量可直接运行的示例,帮你彻底掌握Shell正则表达式,感兴趣的朋友跟随小编一起看看吧

正则表达式（Regular Expression, Regex）是 Shell 编程中处理文本的核心工具，配合 grep、sed、awk 等工具可实现强大的文本查找、替换、提取功能。本教程从基础到进阶，结合大量可直接运行的示例，帮你彻底掌握 Shell 正则表达式。

一、正则表达式概述与 Shell 工具支持

1. 正则表达式的类型

Shell 中主要使用三种正则规范，不同工具支持的类型不同：

类型	说明	支持工具
基本正则（BRE）	基础元字符，部分元字符需转义	`grep`（默认）、`sed`（默认）
扩展正则（ERE）	更多元字符，无需额外转义	`grep -E`、`sed -E`、`awk`
Perl 兼容正则（PCRE）	功能最强，支持非贪婪匹配等高级特性	`grep -P`

2. 核心工具速览

grep：文本查找（Global Regular Expression Print）
sed：文本替换、编辑（Stream Editor）
awk：文本处理、数据分析（Aho-Weinberger-Kernighan）

二、基本正则表达式（BRE）

1. 基础元字符

元字符	功能说明	示例	示例解释
`^`	匹配行首	`grep '^root' /etc/passwd`	匹配以`root`开头的行
`$`	匹配行尾	`grep 'bash$' /etc/passwd`	匹配以`bash`结尾的行
`.`	匹配任意单个字符（除换行）	`grep 'r..t' /etc/passwd`	匹配`r`和`t`之间有 2 个任意字符的行（如`root`、`rbtx`）
`*`	匹配前一个字符 0 次或多次	`grep 'ro*t' /etc/passwd`	匹配`rt`、`rot`、`root`、`rooot`等
`[]`	匹配括号内任意单个字符	`grep 'r[ao]t' file.txt`	匹配`rat`或`rot`
`[^]`	匹配不在括号内的任意字符	`grep 'r[^ao]t' file.txt`	匹配`rbt`、`rct`等，但不匹配`rat`、`rot`
`\`	转义元字符，使其失去特殊含义	`grep 'www\.example\.com' file.txt`	匹配字面量`www.example.com`（`.`被转义）

2. 范围匹配与重复（BRE 需转义）

在 BRE 中，以下元字符必须加 \ 转义才生效：

元字符（转义后）	功能说明	示例
`\{n\}`	匹配前一个字符恰好`n`次	`grep 'ro\{2\}t' /etc/passwd`	匹配`root`（`o`恰好 2 次）
`\{n,\}`	匹配前一个字符至少`n`次	`grep 'ro\{2,\}t' file.txt`	匹配`root`、`rooot`等
`\{n,m\}`	匹配前一个字符`n`到`m`次	`grep 'ro\{1,3\}t' file.txt`	匹配`rot`、`root`、`rooot`

三、扩展正则表达式（ERE）

使用 grep -E、sed -E 或 awk 时，元字符无需转义，功能更强大。

1. 扩展元字符

元字符	功能说明	示例（用grep -E）
`+`	匹配前一个字符 1 次或多次	`grep -E 'ro+t' file.txt`	匹配`rot`、`root`、`rooot`（不匹配`rt`）
`?`	匹配前一个字符 0 次或 1 次	`grep -E 'ro?t' file.txt`	匹配`rt`或`rot`
`	`	或逻辑，匹配左右任意一个	`grep -E 'root	admin' /etc/passwd`	匹配包含`root`或`admin`的行
`()`	分组，将多个字符视为整体	`grep -E '(root)+' file.txt`	匹配`root`、`rootroot`等
`{n}`	匹配前一个字符恰好`n`次（无需转义）	`grep -E 'ro{2}t' file.txt`	匹配`root`
`{n,}`	匹配前一个字符至少`n`次	`grep -E 'ro{2,}t' file.txt`	匹配`root`、`rooot`等
`{n,m}`	匹配前一个字符`n`到`m`次	`grep -E 'ro{1,3}t' file.txt`	匹配`rot`、`root`、`rooot`

四、POSIX 字符类

为了兼容不同字符集（如中文），Shell 提供了 POSIX 字符类，需用 [[]] 包裹：

字符类	说明	等价于（ASCII）
`[:alnum:]`	字母和数字	`[a-zA-Z0-9]`
`[:alpha:]`	字母	`[a-zA-Z]`
`[:digit:]`	数字	`[0-9]`
`[:lower:]`	小写字母	`[a-z]`
`[:upper:]`	大写字母	`[A-Z]`
`[:space:]`	空白字符（空格、制表符等）	`[ \t\n\r\f\v]`
`[:punct:]`	标点符号	`[!\"#$%&'()*+,-./:;<=>?@[\\\]^_`{	}~]`

示例：匹配包含数字的行

grep '[[:digit:]]' file.txt

五、实际工具应用（超详细示例）

1.grep：文本查找

基础用法

# 查找包含"error"的行（忽略大小写）
grep -i 'error' log.txt
# 查找不包含"debug"的行
grep -v 'debug' log.txt
# 显示匹配行的行号
grep -n 'root' /etc/passwd
# 递归查找当前目录下所有文件中的"TODO"
grep -r 'TODO' .

进阶：结合扩展正则

# 查找以"202"开头的年份（如2020、2021...2029）
grep -E '^202[0-9]' dates.txt
# 查找邮箱（简化版）
grep -E '[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}' emails.txt

2.sed：文本替换与编辑

sed 默认使用 BRE，加 -E 启用 ERE。

基础替换

# 将文件中所有"apple"替换为"orange"（直接修改文件：加-i）
sed 's/apple/orange/g' file.txt > new_file.txt
sed -i 's/apple/orange/g' file.txt  # 直接修改原文件
# 只替换第2次出现的"apple"
sed 's/apple/orange/2' file.txt

进阶：结合正则与分组

# 将"root:x:0:0:root:/root:/bin/bash"改为"User: root, Shell: /bin/bash"
# 分组\1匹配root，\2匹配/bin/bash
sed -E 's/^([a-z]+):.*:([^:]+)$/User: \1, Shell: \2/' /etc/passwd
# 删除空行
sed '/^$/d' file.txt
# 删除以#开头的注释行
sed '/^#/d' file.txt

3.awk：文本处理与数据分析

awk 默认使用 ERE，功能极其强大。

基础用法

# 打印/etc/passwd的第1列（用户名）和第7列（Shell）
awk -F: '{print $1, $7}' /etc/passwd
# 打印第3列（UID）大于1000的行
awk -F: '$3 > 1000' /etc/passwd

进阶：结合正则

# 打印以"r"开头的用户名及其Shell
awk -F: '$1 ~ /^r/ {print $1, $7}' /etc/passwd
# 统计日志中"error"出现的次数
awk '/error/ {count++} END {print "Error count:", count}' log.txt
# 提取IP地址（简化版）
awk '/([0-9]{1,3}\.){3}[0-9]{1,3}/ {print $0}' access.log

六、常见实用正则示例

1. 匹配手机号（中国大陆）

grep -E '^1[3-9][0-9]{9}$' phones.txt

2. 匹配 IP 地址（简化版，不验证合法性）

grep -E '([0-9]{1,3}\.){3}[0-9]{1,3}' ips.txt

3. 匹配日期（YYYY-MM-DD）

grep -E '^[0-9]{4}-(0[1-9]|1[0-2])-(0[1-9]|[12][0-9]|3[01])$' dates.txt

4. 提取 HTML 中的链接（简化版）

grep -Eo 'href="[^" rel="external nofollow" ]+"' index.html | sed -E 's/href="([^" rel="external nofollow" ]+)"/\1/'

七、注意事项与避坑指南

转义问题：
- BRE 中 +、?、|、()、{} 需转义，ERE 中无需转义。
- 在 Shell 脚本中使用正则时，注意单引号 ' 和双引号 " 的区别：单引号内的元字符不会被 Shell 解析，推荐使用单引号包裹正则。
贪婪匹配 vs 非贪婪匹配：
- 默认是贪婪匹配（尽可能多匹配），如 a.*b 匹配 aabab 中的整个字符串。
- 非贪婪匹配需用 PCRE（grep -P），如 a.*?b 匹配 aab。
字符集问题：
- 处理中文时，确保终端和文件编码一致（如 UTF-8），推荐使用 POSIX 字符类（如 [:alpha:] 匹配中文字母）。

到此这篇关于Shell正则表达式实战：从入门到精通的文章就介绍到这了,更多相关Shell正则表达式内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python3爬虫之入门基础和正则表达式
这篇文章主要介绍了python3爬虫之入门基础和正则表达式的相关资料,需要的朋友可以参考下
2015-10-10
Python如何使用正则表达式识别代码中的中文、英文和数字
正则表达式是一种强大的工具，可以帮助我们实现识别代码中的中文、英文和数字，本文将分三个部分详细介绍如何使用正则表达式在 Python 中识别代码中的中文、英文和数字，感兴趣的朋友跟随小编一起看看吧
2023-06-06
浅析一个匹配数字和字母密码的正则表达式
最近做项目，遇到这样的需求，要求由数字和字母组成，并且要同时含有数字和字母，且长度要在8-16位之间。下面给大家分享实现代码，要求看看吧
2017-06-06
最新手机号码、电话号码正则表达式
相信大家对正则表达式一定都有所了解和研究，这篇文章主要为大家分享了最新验证手机号码和电话号码的正则表达式,具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2016-11-11
js正则判断非法字符限制输入
这篇文章主要介绍了如何使用js正则判断非法字符限制输入,需要的朋友可以参考下
2014-04-04
正则表达式教程之匹配一组字符详解
这篇文章主要介绍了正则表达式教程之匹配一组字符的方法,详细分析了匹配一组字符的操作技巧与注意事项,具有一定参考借鉴价值,需要的朋友可以参考下
2017-01-01
使用正则表达式从链接中获取图片名称
正则表达式有时可用来判断是否包含某些数据,有时可用来获取匹配数据,下面这篇文章主要给大家介绍了关于使用正则表达式从链接中获取图片名称的相关资料,需要的朋友可以参考下
2022-05-05
vbs:能算出一个字符在一字段里共出现有几次的函数
vbs:能算出一个字符在一字段里共出现有几次的函数...
2007-04-04
$超强变态的正则(\w)((?=\1\1\1)(\1))+讲解$
超强变态的正则(\w)((?=\1\1\1)(\1))+讲解
这篇文章主要介绍了超强变态的正则(\w)((?=\1\1\1)(\1))+等好几个比较强大到变态的规则，这里跟着脚本之家小编一起学习吧
2020-02-02
MySQL中REGEXP正则表达式使用大全
使用正则表达式操作mysql数据库非常方便，本篇文章给大家分享mysql中REGEXP正则表达式使用大全，感兴趣的朋友跟着小编一起看看吧
2015-09-09