python 正则表达式 反斜杠(/)的麻烦和陷阱

 更新时间:2009年08月23日 19:57:38   作者:  
这里是一点小心得。 由于正则表达式使用反斜杠来转义特殊字符,而python自身处理字符串时,反斜杠也是用于转义字符,这样就产生了一个双重转换的问题
要匹配字符串中1个反斜杠应该怎么写正则表达式?"\\",这样行吗?试试就知道了,re模块抛异常了,因为"\\"就是一个反斜杠,对于正则表达式解析器来说,是一个转义字符,但是后面啥也没有,自然就报错了,"\\\"三个肯定是不行的,试试四个"\\\\",完美匹配。
复制代码 代码如下:

import re
re_str_patt = "\\\\"
reObj = re.compile(re_str_patt)
str_test = "abc\\cd\\hh"
print reObj.findall(str_test)


输出:['\\', '\\']

这里要这么理解,首先第一重转换是字符串自身的转义,那么"\\\\",实际上就是表示两个反斜杠(两个字符),然后传入正则表达式解析器,因为反斜杠依然是转义字符,那么进行第二重转换,两个反斜杠就代表一个反斜杠,所以就能和一个反斜杠进行匹配了,那么匹配连续的两个反斜杠,写正则表达式时就要写8次"\"了,相当壮观,要匹配/d+(这个在正则表达式里面表示连续1一个以上的数字字符)这个字符串怎么写呢?
复制代码 代码如下:

import re
re_str_patt = "\\\\d\\+"
print re_str_patt
reObj = re.compile(re_str_patt)
print reObj.findall("\\d+")
写成re_str_patt = "\\\\d\+"也行,因为\+对于字符串来说,没有转义意义,所以就当成一个反斜杠了。

在python中写正则表达式时用得最多的是raw字符串,原生字符串,什么意思?就是只有一重转换了,没有字符串转换了,只在正则表达式内部进行转换了,这样匹配一个反斜杠的正则表达式可以这样写,re_str_patt = r"\\",有人会想,以后写windows的文件路径什么的方便了,呵呵直接 path = r"c:\myforder\xx" 搞定,是的,这句没有问题,但是如果你写成 path = r"c:\myforder\xx\",直接报错了,为什么?因为反斜杠虽然不作为转义字符了,但是还是对它后面的引号(包括单引号)有影响,使这个引号不被视为字符串的终止,以为它后面还有字符,但是实际没有,因此会报错。其实可以反过来想raw字符串里面要表示引号怎么办呢?,可以发现 path = r"\\123\"xxx" 是可以的,那用raw字符串岂不是有局限性?不过raw在设计之初就是用来支持正则表达式的,而在正则里面反斜杠是转义字符,所以不可能出现在字符串的末尾的,所以建议不要图方便在其他的地方使用raw。

相关文章

  • 读懂正则表达式就这么简单

    读懂正则表达式就这么简单

     对于正则表达式,相信很多人都知道,但是很多人的第一感觉就是难学,因为看第一眼时,觉得完全没有规律可寻,其实也没有你想象的那么难,今天小编就通过本文带领大家一起去学习正则表达式知识
    2016-11-11
  • SQL正则表达式和约束使用详解

    SQL正则表达式和约束使用详解

    这篇文章主要给大家介绍了关于SQL正则表达式和约束的相关资料,SQL正则表达式是一种功能强大的工具,能够在文本数据中实现高效的模式匹配和数据提取,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-04-04
  • 正则表达式进行页面表单验证功能

    正则表达式进行页面表单验证功能

    一般做到注册页面的时候,当用户填完信息,都需要对他们的信息进行验证,这就要用到正则表达式。本文通过实例给大家介绍正则表达式进行页面表单验证功能,一起看看吧
    2017-03-03
  • 正则验证不能含有中文的实现方法【jQuery与java实现】

    正则验证不能含有中文的实现方法【jQuery与java实现】

    这篇文章主要介绍了正则验证不能含有中文的实现方法,结合jQuery与java两种实现方法分析了针对中文的正则验证操作技巧,需要的朋友可以参考下
    2017-01-01
  • 正则表达式模式匹配字符串基础知识

    正则表达式模式匹配字符串基础知识

    这篇文章主要介绍了正则表达式模式匹配字符串基础知识,分为匹配字符串的基本规则和正则匹配、查找与替代的知识,本文给大家介绍的非常不错,需要的朋友可以参考下
    2017-11-11
  • JavaScript 正则表达式使用详细参数

    JavaScript 正则表达式使用详细参数

    正则表达式(regular expression)对象包含一个正则表达式模式(pattern)。它具有用正则表达式模式去匹 配或代替一个串(string)中特定字符(或字符集合)的属性(properties)和方法(methods)。
    2008-03-03
  • PHP 正则表达式特殊字符 [:alnum:] [:alpha:] 等

    PHP 正则表达式特殊字符 [:alnum:] [:alpha:] 等

    正则表达式中有两个很重要的特殊字符就是"[ ]"。他们可以匹配"[]"之中出现过的字符,比如"/[az]/"可以匹配单个字符"a"或者"z";如果把上面的表达式改成这样"/[a-z]/",就可以匹配任何单个小写字母,比如"a"、"b"等等。
    2011-09-09
  • python中使用正则表达式将所有符合条件的字段全部提取出来

    python中使用正则表达式将所有符合条件的字段全部提取出来

    这篇文章主要介绍了python中使用正则表达式将所有符合条件的字段全部提取出来,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-08-08
  • 正则表达式中的反向预搜索实现

    正则表达式中的反向预搜索实现

    这几天在用正则表达式做一个小程序,需要替换内容中的某些特殊字符串。这些字符串的出现是有规律的,那就是在它左面总会特定的内容出现,右面却没有。于是自然就想到了反向预搜索。
    2009-09-09
  • 正则表达式话题

    正则表达式话题

    正则表达式话题...
    2006-12-12

最新评论