正则表达式学习教程之回溯引用backreference详解

 更新时间:2017年01月07日 14:47:50   作者:MikanMu  
这篇文章主要介绍了正则表达式学习教程之回溯引用backreference,结合实例形式详细分析了回溯引用的概念、功能及实现技巧,需要的朋友可以参考下

本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考,具体如下:

在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。

一、问题引入

一个在HTML页面中匹配标题标签(H1—H6)的问题:

文本:

<body>
<h1>Welcome to my page</H1>
Content is divided into twosections:<br>
<h2>Introduction</h2>
Information about me.
<H2>Hobby</H2>
Information about my hobby.
<h2>This is invalid HTML</h3>
</body>

正则表达式:<[hH][1-6]>.*?</[hH][1-6]>

结果:

<body>
【<h1>Welcome to my page</H1>】
Content is divided into twosections:<br>
【<h2>Introduction</h2>】
Information about me.
【<H2>Hobby</H2>】
Information about my hobby.
【<h2>This is invalid HTML</h3>】
</body>

分析:模式<[hH][1-6]>匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了<h1>、<h2>,</[hH][1-6]>匹配到了</h1>、</h2>、</h3>;这里使用了懒惰型元字符来匹配标签中的文本,否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出,有一个无效的标签也匹配上了,即<h2></h3>,它们根本不能配对。要解决这个问题,就需要使用到回溯引用(backreference)。

二、回溯引用匹配

回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:

文本:

<body>
<h1>Welcome to my page</H1>
Content is divided into twosections:<br>
<h2>Introduction</h2>
Information about me.
<H2>Hobby</H2>
Information about my hobby.
<h2>This is invalid HTML</h3>
</body>

正则表达式:<[hH]([1-6])>.*?</[hH]\1>

结果:

<body>
【<h1>Welcome to my page</H1>】
Content is divided into twosections:<br>
【<h2>Introduction</h2>】
Information about me.
【<H2>Hobby</H2>】
Information about my hobby.
<h2>This is invalid HTML</h3>

分析:首先匹配开始标题标签的模式<[hH]([1-6])>,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为</[hH]\1>,其中\1表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那\1也匹配到1,如果匹配到2,那\1也匹配到2,所以最后一个无效的标题标签就不会被匹配到了。

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

更多关于JavaScript相关内容感兴趣的读者可查看本站专题:《JavaScript正则表达式技巧大全》、《JavaScript替换操作技巧总结》、《JavaScript查找算法技巧总结》、《JavaScript数据结构与算法技巧总结》、《JavaScript遍历算法与技巧总结》、《JavaScript中json操作技巧总结》、《JavaScript错误与调试技巧总结》及《JavaScript数学运算用法总结

希望本文所述对大家JavaScript程序设计有所帮助。

相关文章

  • 精确查找PHP WEBSHELL木马 修正版

    精确查找PHP WEBSHELL木马 修正版

    上篇提到了关于网上流传查找PHP webshell的python脚本中,不严谨的代码,并且给出了一个python的检测代码,同时,下文里也提到不能检测到反引号的命令执行的地方。今天,我想了下,现在把思路发出来。
    2011-04-04
  • VSCode正则表达式匹配多行实战案例

    VSCode正则表达式匹配多行实战案例

    正则表达式是一种强大的文本模式匹配工具,可以用来搜索和修改文本,下面这篇文章主要给大家介绍了关于VSCode正则表达式匹配多行实战案例的相关资料,需要的朋友可以参考下
    2024-03-03
  • IOS正则表达式判断输入类型(整理)

    IOS正则表达式判断输入类型(整理)

    在开发过程中,有时需要对用户输入的类型做判断,最常见是在注册页面即用户名和密码。接下来通过本文给大家分享IOS正则表达式判断输入类型,一起学习吧
    2017-01-01
  • 正则表达式匹配不包含某些字符串的技巧

    正则表达式匹配不包含某些字符串的技巧

    这篇文章主要介绍了正则表达式匹配不包含某些字符串的技巧,详细分解了应该怎么做和这么做的原因,需要的朋友可以参考下
    2014-07-07
  • 常用的正则表达式集锦

    常用的正则表达式集锦

    正则式太难学,而且容易忘记,很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。自己做个记录,也给朋友们做个参考。
    2015-06-06
  • 36个正则表达式(开发效率提高80%)

    36个正则表达式(开发效率提高80%)

    我们在日常的Java开发中,经常需要处理一些字符串,本文主要介绍了36个常用正则表达式,感兴趣的可以了解一下
    2021-11-11
  • 正则表达式使用示例详解

    正则表达式使用示例详解

    正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。这篇文章重点给大家介绍正则表达式使用示例,感兴趣的朋友一起看看吧
    2019-05-05
  • javascript中使用正则表达式进行字符串验证示例

    javascript中使用正则表达式进行字符串验证示例

    我写的一个表达式验证示例:功能如下:用户名,不能为空;密码6为数字;密码确认,两次输入密码必须相同;身份证号码必须是15位,或者是18位,最末尾也可以是X
    2013-05-05
  • 详解正则表达式实现二代身份证号码验证

    详解正则表达式实现二代身份证号码验证

    这篇文章主要介绍了正则表达式实现二代身份证号码验证的方法,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2018-06-06
  • php 正则 不包含某字符串的正则表达式

    php 正则 不包含某字符串的正则表达式

    这篇文章主要介绍了判断一个字符串中是否含有另一字符串,php有很多方法
    2009-09-09

最新评论