python如何利用re模块正则表达式匹配ip地址

 更新时间:2023年08月31日 10:05:25   作者:shanf7921  
这篇文章主要介绍了python如何利用re模块正则表达式匹配ip地址问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

python中利用正则表达式判断ipv4地址是否合法

ip地址的范围为0.0.0.0-255.255.255.255,分成四段,则每段的范围都是0-255,因此,以一段进行分析:

在进行书写匹配规则时,可以将每段的取值分为4个区间。即0-99、100-199、200-249、250-255。

其正则匹配的表达式应为:

# 匹配 0-255的表达式书写方法pattern = re.compile(r'([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])')
# 匹配 0-255的表达式书写方法
pattern = re.compile(r'([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])')

以下作具体解释

  • 0-99:[1-9]?\d

问号(?)表示匹配0或1次,此表达式可以匹配0-99内任意是数值。

  • 100-199:1\d\d

第一位为1,第二位和第三位为0-9之间的任意数值。

  • 200-249:2[0-4]\d

200-249范围内,第一位固定为2,第二位取值范围为[0-4],第三位为0-9之间任意数字,使用’\d’进行匹配。

  • 250-255:25[0-5]

250-255范围内,前两位固定为25,最后一位取值为[0-5]。

使用 | 符号,将四部分连接起来,即是一条完整的匹配0-255范围的表达式:([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])

此时应该已经能够理解,如何进行一段ip地址的匹配,再讲解如何匹配完整的ip地址。

简单理解就是(0-255).(0-255).(0-255).(0-255)。使用四段相同的表达式,并在四段表达式之间增加3个点(.)。

可将前三段ip值和三个点看作三部分,即每部分为(0-255).。

(0-255).的匹配表达式可书写为(([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.),此表达式需要使用三次,因此可以写成 (([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.){3}

最终,匹配0.0.0.0-255.255.255.255的表达式如下所示:

# 匹配 0.0.0.0-255.255.255.255的表达式书写方法
pattern = re.compile(r'(([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.){3}([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])')

下面作几个测试用例(使用fullmatch)

In [1]: pattern.fullmatch('0.123.12.23')
Out[1]: <re.Match object; span=(0, 11), match='0.123.12.23'>
In [2]: pattern.fullmatch('192.168.0.1')
Out[2]: <re.Match object; span=(0, 11), match='192.168.0.1'>
In [3]: pattern.fullmatch('255.255.255.255')
Out[3]: <re.Match object; span=(0, 15), match='255.255.255.255'>
# 以上三个ip都属于正常ip,因此能够正确匹配
# -----------------------------------------------
# 以下两个示例不是正确的ip,所以匹配不到,无输出结果
In [4]: pattern.fullmatch('255.255.255.256')
In [5]: pattern.fullmatch('1255.255.255.255')

再使用search、match方法对以上两个错误ip进行匹配测试。

In [11]: pattern.search('255.255.255.256')
Out[11]: <re.Match object; span=(0, 14), match='255.255.255.25'>
# 匹配结果为 255.255.255.25
In [12]: pattern.search('1255.255.255.255')
Out[12]: <re.Match object; span=(1, 15), match='255.255.255.25'>
# 匹配结果为 255.255.255.25
In [13]: pattern.match('255.255.255.256')
Out[13]: <re.Match object; span=(0, 14), match='255.255.255.25'>
# 匹配结果为 255.255.255.25
In [14]: pattern.match('1255.255.255.255')
# 无输出结果
# -----------------------------------
# 请注意观察以下示例的匹配结果
In [15]: pattern.search('257.127.0.0.1')
Out[15]: <re.Match object; span=(1, 11), match='57.127.0.0'>
In [16]: pattern.search('255.255.255.122.256')
Out[16]: <re.Match object; span=(0, 15), match='255.255.255.122'>

为何会出现上述结果?首先对于search、match、fullmatch进行一个对比:

方法解释
search只匹配一次,查找整个字符串
match只匹配一次,从开头开始匹配
fullmatch对字符串进行完整匹配

由于search匹配时,会查找整个字符串,然后返回满足表达式的结果。

所以使用search方法进行匹配时,对于ip的第一个字段和最后一个字段出错的情况下,会自动进行ip址的截取,尽量使结果满足表达式的要求,但是这种结果并不是我们想要的。

  • match是从头开始匹配,当ip地址的前三段都正确,而最后一个字段出错时,也无法得出预期的结果。
  • fullmatch是完全匹配,因此字符串要完全满足ip地址规则时,才会返回正确结果,ip地址有误时,无输出(输出为None)。

当然,非要使用search和match进行匹配也是可以的,首先了解一下“零宽断言”。

零宽断言

用于查找特定内容之前或之后的内容,但并不包括特定内容本身(零宽)。

类似于^、 $、 \b一样的作用,指定某一位置需要满足某些条件(断言)。

表达式说明
(?=exp)匹配exp前面的位置 (此位置后面是exp)
(?<=exp)匹配exp后面的位置(此位置前面是exp)
(?!exp)此位置后面不能是exp
(?<!exp)此位置前面不能是exp

匹配ip地址时,不允许对不合法的地址进行截取 以得到符合规则的ip地址,即是要求:匹配结果在原字符串中的位置之前和之后不能有被截取的点(.)和数字。

根据以上分析 修改原有正则表达式,在原表达式的前面添加(?<![\.\d]),最后面添加(?![\.\d]),即修改之后完整的表达式为:

pattern = re.compile(r'(?<![\.\d])(([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.){3}([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])(?![\.\d])')

通过上面这条正则表达式,对之前错误的ip地址重新进行匹配验证,

结果如下:

In [1]: import re
In [2]: pattern = re.compile(r'(?<![\.\d])(([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])\.){3}([1-9]?\d|1\d\d|2[0-4]\d|25[0-5])(?![\.\d])')
# 以下各语句执行后都无输出结果,说明正则匹配不成功,ip地址不合法
In [11]: pattern.search('255.255.255.256')
In [12]: pattern.search('1255.255.255.255')
In [13]: pattern.match('255.255.255.256')
In [14]: pattern.match('1255.255.255.255')
In [15]: pattern.search('257.127.0.0.1')
In [16]: pattern.search('255.255.255.122.256')

总结

以上就是在python中如何利用re模块判断ip地址是否合法的介绍。

仅为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 利用python如何处理nc数据详解

    利用python如何处理nc数据详解

    目前很多数据以nc格式存储,下面这篇文章主要给大家介绍了关于利用python如何处理nc数据的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值。需要的朋友们下面来一起看看吧
    2018-05-05
  • python获取天气接口给指定微信好友发天气预报

    python获取天气接口给指定微信好友发天气预报

    这篇文章主要介绍了python获取天气接口给指定微信好友发天气预报的步骤,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-12-12
  • Python中的response.text与content区别详解

    Python中的response.text与content区别详解

    这篇文章主要介绍了Python中的response.text与content区别详解, 从网络请求下来的数据,他们都是字节类型的,如果服务器不指定的话,默认编码是"ISO-8859-1",我们使用text直接拿到的是字符串类型,没有进行解码操作,则会出现乱码问题,需要的朋友可以参考下
    2023-12-12
  • Python入门教程(八)PythonCasting用法

    Python入门教程(八)PythonCasting用法

    这篇文章主要介绍了Python入门教程(八)PythonCasting用法,Python是一门非常强大好用的语言,也有着易上手的特性,本文为入门教程,需要的朋友可以参考下
    2023-04-04
  • Python通过递归函数输出嵌套列表元素

    Python通过递归函数输出嵌套列表元素

    这篇文章主要介绍了Python通过递归函数输出嵌套列表元素,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • 关于python的编码与解码decode()方法及zip()函数

    关于python的编码与解码decode()方法及zip()函数

    这篇文章主要介绍了关于python的编码与解码decode()方法及zip()函数,encode0 方法是字符串对象内置的一个实现方法用于实现编码操作,需要的朋友可以参考下
    2023-04-04
  • python实现连续图文识别

    python实现连续图文识别

    这篇文章主要为大家详细介绍了python实现连续图文识别功能,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-12-12
  • 5个Python杀手级的自动化脚本分享

    5个Python杀手级的自动化脚本分享

    Python是一种功能强大的语言,广泛用于自动执行各种任务,只要想通过自动化日常任务来节省时间的人,Python 都能满足您的需求。本文整理了5个Python脚本,希望对大家有所帮助
    2023-01-01
  • Python模块结构与布局操作方法实例分析

    Python模块结构与布局操作方法实例分析

    这篇文章主要介绍了Python模块结构与布局操作方法,结合实例形式分析了Python模块与布局的相关概念、使用方法与相关注意事项,需要的朋友可以参考下
    2017-07-07
  • Python中的各种装饰器解析

    Python中的各种装饰器解析

    这篇文章主要介绍了Python中的各种装饰器解析,Python装饰器可以在不改变函数原实现方式的前提下,为函数添加额外的功能,需要的朋友可以参考下
    2023-11-11

最新评论