js 正则表达式学习笔记之匹配字符串

 更新时间:2014年05月21日 10:12:17   作者:  
这篇文章主要介绍了js 正则表达式匹配字符串,需要的朋友可以参考下

今天看了第5章几个例子,有点收获,记录下来当作回顾也当作分享。

关于匹配字符串问题,有很多种类型,今天讨论 js 代码里的字符串匹配。(因为我想学完之后写个语法高亮练手,所以用js代码当作例子)

复制代码 代码如下:

var str1 = "我是字符串1哦,快把我取走", str2 = "我是字符串2哦,快把我取走";

比如这样一个字符串,匹配起来很简单 /"[^"]*"/g 即可。

 



PS: 白色截图是 chrome 34 控制台中运行的结果,深灰色是 sublime text 结果。

很容易就取到内容了,可是亲,你有没有想过,js字符串里允许转义。

 

复制代码 代码如下:

var str1 = "我是字符串1哦,\"快把我取走\"", str2 = "我是字符串2哦,\"快把我取走\"";

这不是我们想要的结果,所以我们要处理下转义问题。
转义的规则是 \ 后面跟着一个字符,所以我们用 \\. 去匹配它,就有了这样的正则 /"(?:\\.|[^"])*"/g

 
 
可能对于正则不熟悉的朋友,一下子从 /"[^"]*"/g 变到 /"(?:\\.|[^"])*"/g 后理解不了,我简单说明下。
(?:) 是非捕获组,就是不会把内容抓取保存到内存里的。
\\. 用于匹配 \" \' \a 之类的转义字符,匹配成功的话消耗2个字符。
[^"] 匹配除了 " 以外的所有字符,匹配成功的话消耗1个字符。
所以这个表达式的意思是,先匹配 \. 这样转义,如果成功会消耗掉正确的转义,如果不成功就用 [^"] 匹配。

消耗掉正确的转义的意思是,比如 "aa\\aa\"aa\ufffaa" 都会被正常匹配,因为这些都在正常的转义。
形如 "aa\\aa\"aa\ufff\\"aa" 这里的 \\" 其中 \\ 会被匹配,而 " 既不满足 \\. 也不满足 [^"]
所以这个匹配结果会是 "aa\\aa\"aa\ufff\\" 后面的 aa" 无法匹配到。


所以现在我们得到了比较强力的正则,可以有效的匹配 js 代码中的字符串了。

骚等,好像还有哪里不对。
js 字符串允许折行,形如这样:

复制代码 代码如下:

var str = "大家好\
我是js";

但是这样的字符串用刚才的正则能匹配么?答案是能。
因为 \ 不能被 \\. 匹配,但是可以被 [^"] 匹配到,\ 后面一个字符是 \r, \n 或 \r\n (具体是什么换行符要看系统了) 都能被 [^"] 匹配到,所以我们无意间写了个强力的表达式。

现在剩下最后一个问题了,就是 ' 的匹配。
我们修改下表达式 /"(?:\\.|[^"])*"|'(?:\\.|[^'])*'/g 就好了。

来测试一下:

复制代码 代码如下:

var str1 = "我是字符串1哦,\
\"快把我取走\"", str2 = '我是字符串2哦,\
\'快把我取走\'';

匹配成功。

相关文章

  • js中过滤特殊字符的正则表达式

    js中过滤特殊字符的正则表达式

    js中用正则表达式 过滤特殊字符 ,校验所有输入域是否含有特殊符号
    2010-09-09
  • 正则表达式模式修正符(/ies)

    正则表达式模式修正符(/ies)

    下面列出了当前在 PCRE 中可能使用的修正符。括号中是这些修正符的内部 PCRE 名。修正符中的空格和换行被忽略,其它字符会导致错误。
    2010-08-08
  • 正则表达式中的反向预搜索实现

    正则表达式中的反向预搜索实现

    这几天在用正则表达式做一个小程序,需要替换内容中的某些特殊字符串。这些字符串的出现是有规律的,那就是在它左面总会特定的内容出现,右面却没有。于是自然就想到了反向预搜索。
    2009-09-09
  • 收集整理ASP.NET中17种常用正则表达式

    收集整理ASP.NET中17种常用正则表达式

    正则表达式在程序开发中的应用非常广泛,本文给大家分享了asp.net中17种常用的正则表达式,需要的朋友可以参考下
    2015-09-09
  • 浅谈正则速记法的技巧

    浅谈正则速记法的技巧

    这篇文章主要介绍了浅谈正则速记法的技巧,对大部分人来说,正则主要是难记,其实只要对正则符号分类记忆,就会发现核心概念其实特别简单,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • 深入浅析正则表达式 捕获组

    深入浅析正则表达式 捕获组

    捕获组(capturing group)是正则表达式里比较常用,也是比较重要的概念,我个人觉得掌握这部分的知识是非常重要的,感兴趣的朋友跟随小编一起看看吧
    2019-04-04
  • js正则表达式实现数字每隔四位用空格分隔代码

    js正则表达式实现数字每隔四位用空格分隔代码

    这篇文章主要介绍了js正则表达式实现数字每隔四位用空格分隔代码,需要的朋友可以参考下
    2016-12-12
  • 匹配5到10位无重复数字的正则表达式

    匹配5到10位无重复数字的正则表达式

    对于有重复的5到10位数字可以使用\d{5,10} 这样的正则,无重复的5到10位数字我考虑了一下还不会,最然只好查网上,找了段代码,分享给需要的朋友
    2012-10-10
  • Python正则表达式保姆式教学详细教程

    Python正则表达式保姆式教学详细教程

    正则作为处理字符串的一个实用工具,在Python中经常会用到,比如爬虫爬取数据时常用正则来检索字符串。这篇文章主要介绍了Python正则表达式保姆式教学详细教程,需要的朋友可以参考下
    2021-08-08
  • 正则表达式之字符串模式匹配实例详解

    正则表达式之字符串模式匹配实例详解

    正则表达式就是一种强大而灵活的文本处理工具,正则可以很好的解决这类字符串校验问题,下面这篇文章主要给大家介绍了关于正则表达式之字符串模式匹配的相关资料,需要的朋友可以参考下
    2022-04-04

最新评论