正则表达式中的反向预搜索(上)

 更新时间:2009年12月14日 03:13:50   作者:  
这几天在用正则表达式做一个小程序,需要替换内容中的某些特殊字符串。这些字符串的出现是有规律的,那就是在它左面总会特定的内容出现,右面却没有。于是自然就想到了反向预搜索。
在以前的应用,大多是应用正向预搜索情况。也就是说,在查找内容的右面有特定的内容限定,例如下面的例子:
复制代码 代码如下:

var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04';
var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim;
str3.match(reg3);
alert(RegExp.$1); //结果是2G

(.*(?=\;OS\:) 就是典型的正向预搜索,只有右面内容是“;OS: ”才会被匹配到。
但是现在要实现的效果,左面的内容是固定,而不是右面。可是JavaScript并不支持反向预搜索。我相信,细心的朋友已经发现了,其实上面的例子已经达到了这个目的(前面的Memory\:\s+ 限定了左面的内容)。下面再给出一个例子:
复制代码 代码如下:

//程序目的,去掉图片路径中的域名
var str = '<img src="http://news.163.com/sports/yao.jpg" >';
var reg1 = /(\<img)(.*(?=(http|https)\:\/\/))((http|https)\:\/\/[^\/]*)/gim;
str.match(reg1);
alert(str.replace(RegExp.$4,''));

那么到底有没有反向预搜索呢?答案是肯定的,可是现实是残酷的。我查阅了一些资料,上面提到反向预搜索的形式是以?<= 或者?<! 为引导的。遗憾的是JavaScript并不支持,在高版本的Java中已获支持,于是就编写了下面的测试程序(JRE1.6.0_03):
复制代码 代码如下:

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegExpTest {
    public static void main(String[] args){
        Pattern p = Pattern.compile("((?<=\\<img.*(?=(http|https)))(http|https))");
        Matcher matcher = p.matcher("<img src="http://news.163.com/sports/yao.jpg"/>");
        System.out.println(matcher.matches());
    }
}

程序本身应该没有什么问题,但是运行结果:

Exception in thread "main" java.util.regex.PatternSyntaxException: Look-behind group does not have an obvious maximum length near index 27
((?<=\<img.*(?=(http|https)))(http|https))

我Google了半天,最后得到的唯一结果就是换种写法。希望看到这篇文章的朋友,如果已经实现了这种效果,一定要留言不吝赐教。

另外,在我看文档时看到了?:引导的正则表达式,上面说是“匹配不存储”,百思不得其解。感觉还是代码来的实在,写一个看一下:
复制代码 代码如下:

var str2 = '客户端名称';
var reg2 = /(客户端名(?:称)?)/;
str2.match(reg2);
alert(RegExp.$1); //客户端名称
alert(RegExp.$2); //空字符串
//不使用?:
reg2 = /(客户端名(称)?)/;
str2.match(reg2);
alert(RegExp.$1); //客户端名称
alert(RegExp.$2); //称

敏捷开发思想说:代码是最好的文档。给了我借口,呵呵。

相关文章

  • 正则表达式匹配路由的实现代码

    正则表达式匹配路由的实现代码

    这篇文章主要介绍了正则表达式匹配路由的实现代码,代码也很简单,感兴趣的朋友参考下本文
    2018-07-07
  • PHP中过滤常用标签的正则表达式

    PHP中过滤常用标签的正则表达式

    在 php 项目中,经常要用到一些过滤标签的正则表达式,收藏一下备用
    2014-05-05
  • JS的正则表达式常用检测代码

    JS的正则表达式常用检测代码

    JS的正则表达式常用检测代码,需要做表单检测的朋友可以参考下。利用正则的检测代码,更强,代码更少。
    2011-01-01
  • asp.net(c#) 使用Rex正则来生成字符串数组的代码

    asp.net(c#) 使用Rex正则来生成字符串数组的代码

    我们在项目中,经常要使用正则表达式,现在有一个工具可以按正则表达式生成数据.正则表达式的语法忘记了吗?
    2010-05-05
  • 正则表达式链接替换函数的技巧

    正则表达式链接替换函数的技巧

    这篇文章给大家介绍正则表达式链接替换函数的技巧,涉及到正则表达式替换相关知识,对正则表达式链接替换函数的技巧感兴趣的朋友一起学习吧
    2015-11-11
  • 匹配 IP 地址与域名的正则表达式

    匹配 IP 地址与域名的正则表达式

    本篇文章介绍了,用于匹配IP地址与域名的正则表达式,并对域名知识做了些介绍,有需要的朋友,可以参考下。
    2015-09-09
  • 如何快速学习正则表达式

    如何快速学习正则表达式

    在日常工作中,我们经常写正则表达式,比如在表单中经常用来验证用户输入的格式是否正确。接下来通过本文给大家介绍如何快速学习正则表达式,感兴趣的小伙伴一起学习吧
    2016-05-05
  • JavaScript正则表达式下之相关方法

    JavaScript正则表达式下之相关方法

    这篇文章主要介绍了JavaScript正则表达式下之相关方法 的相关资料,需要的朋友可以参考下
    2016-05-05
  • 正则表达式小结篇

    正则表达式小结篇

    本文是小编给大家收集整理的关于正则表达式小结,非常不错,具有参考借鉴价值,需要的朋友一起看看吧
    2016-12-12
  • Java中使用正则表达式处理文本数据

    Java中使用正则表达式处理文本数据

    正则表达式就是一个字符串,但和普通的字符串不同的是,正则表达式是对一组相似字符串的抽象。本文将给大家介绍java中使用正则表达式处理文本数据的相关的资料,感兴趣的朋友一起看看吧
    2015-10-10

最新评论