正则表达式不包含属性

更新时间：2008年07月15日 22:15:21 作者：

一个标签里不包含某个属性的正则表达式的写法

找出所有img标签的，没有带说明属性alt的标签：

正则：<img(?![^<>]*?alt[^<>]*?>).*?>
例子：<img src="" alt=""> <img src="" > <img src="" title=""> <img src="" id=""> <img src="" title="" alt="">

扩展，如果要找没有带title属性的a应该是：

正则：<a(?![^<>]*?title[^<>]*?>).*?>
例子：<a src="" alt=""> <a src="" > <a src="" title=""> <a src="" id=""> <a src="" title="" alt="">
用正则表达式找出不包含连续字符串abc的单词

[^abc]表示不包含a、b、c中任意字符, 我想实现不包含字符串abc应该如何写表达式?

就我自己而言，这个问题最简单的解决方法是使用编程语言的配合，找出那些包含abc的，剩下的就是不包含的了——懒人的风格。但我写的是教程，读者未必都有编程的基础，有些只是使用一些工具从txt文档中抽取出一些信息，所以要回答还是必须完全通过正则表达式来完成。

于是打开了RegexTester,开始试验，先是试了使用((?'test'abc)|.)*(?(test)(?!))(含意是：查找abc，或任意的字符，如果找到了abc,就把它存入命名为test的组里，到最后检查test组里是否有内容，如果有就匹配失败，相关说明见教程)，结果是"abc","aabc","abcd","aa"都能通过测试，看来是到最后测试到test组存在后又回溯了，此解决方案不可行。

然后又试了(.(?!abc))*（找出所有后面不是abc的字符），结果是"abc","abcd"通过测试，"aabc"则只截取了后面的"abc",显然不行。

那加强条件试试:((?<!abc).(?!abc))*(找出所有前面和后面都不是abc的字符)，结果是所有包含abc的字符串都只截取了里面的"abc",不包含abc的则直接通过。

现在看来有点戏了，但是怎么把那些内部包含abc的字符串过滤掉呢？这个问题换句话说也就是怎么匹配整体而不是部分呢？现在需要明确用户的需求了：如果用户想要找的是单词，那就在表达式的两端加上\b,如果要找的是行，就加上^和$。由于用户的问题没有明确说明，我就当作是单词吧。

于是等到了这样的表达式：\b((?<!abc).(?!abc))*\b,经过测试，这个表达式能匹配所有不包含abc的单词，以及单词abc。

怎么排除单词abc?经过一番思考，最后我认为判断单词是否以a开头的方式最为方便：\b(a(?!bc)|[^a](?!abc))((?<!abc).(?!abc))*\b(要么以后面不是bc的a开头，要么不以a开头，除了开头后面所有的字符必须前面和后面都不是abc)。经过测试，完全满足要求，Bingo!

使用正则表达式查找不包含连续字符串abc的单词,最终结果：\b(a(?!bc)|[^a](?!abc))((?<!abc).(?!abc))*\b
----------------
更新:根据maple的评论,更简洁的作法是:\b((?!abc)\w)+\b

正则表达式-不包含某个字符串

在使用正则表达式的场合，常常有这种需求，就是匹配一个不包含某个子串的子符串。比如说，我要从“eabcdfgh”得到"cd"之前的子串。有些人可能会写:

([^cd]*)

这种写法是彻底错误的，因为[]中的是集合，也就是说，[^cd]表示不等于c或者d,而不是cd。下面的程序中没有cd,但eab还是被匹配出来了。

复制代码代码如下:

String s = "([^cd]*)";  
Match m = Regex.Match("eabcfgh", s);  
MessageBox.Show(m.Value);//eab  
MessageBox.Show(m.Groups[1].Value);//eab 

上面这种写法是错的比较离谱的，正常青年一般都可以避免这种错误。在特殊情况下，正则表达式可以这么写，而且效率是比较高的。

([/s/S]*cd)

先说明下/s/S是表示匹配任何字符。所谓特殊情况，就是我知道这个字符串中必有cd的存在。假如，我的要求是匹配不包含cd的部分（为了描述方便，只匹配cd之前的部分），也就是说，当cd不存在时，应该把整个字符串都取出来。

复制代码代码如下:

String s = "((.(?!cd))*.)";  
//String s = "([/s/S]*cd)";  
Match m = Regex.Match("eabcdfgh", s);  
MessageBox.Show(m.Value);//eab  
MessageBox.Show(m.Groups[1].Value);//eab 

这种写法终于符合要求了。不过值得一提的是，相较前一种而言，它的效率比较低。
回顾一下相关的语法:
(?:子表达式) 定义非捕获组。

复制代码代码如下:

//定义非捕获组  
String s = "e(?:ab)(.*)";  
Match m = Regex.Match("eabcd", s);  
MessageBox.Show(m.Value);//eabcd  
MessageBox.Show(m.Groups[1].Value);//cd 

ab是被匹配的，但是它所在的组没有被捕获，Group[1]是cd

(?=子表达式) 零宽度正预测先行断言。

复制代码代码如下:

//零宽度正预测先行断言  
//String s = "b(cd|de)(.*)";  
String s = "b(?=cd|de)(.*)";  
Match m = Regex.Match("eabcdfg", s);  
MessageBox.Show(m.Value);  
MessageBox.Show(m.Groups[1].Value);//区别 cd  cdfg 

这种写法和注释掉的写法是有区别的，区别就是“零宽度”，这种写法会被捕获，也就是不占一个Group。

(?!子表达式) 零宽度负预测先行断言。

！表示非，就是不包含，同样是零宽度，不会被捕获。

(?<=子表达式) 零宽度正回顾后发断言。

例:(?<=19)\d{2}\b

“1851 1999 1950 1905 2003”中的“99”、“50”和“05”

(?<!子表达式) 零宽度负回顾后发断言。

例:(?<!19)\d{2}\b

“1851 1999 1950 1905 2003”中的“51”和“03”

您可能感兴趣的文章:

asp.net常用正则表达式
比较常用的多种语言支持的正则整理收集
2008-08-08
正则表达式练习器
正则表达式练习器...
2006-06-06
VSCode正则表达式匹配多行实战案例
正则表达式是一种强大的文本模式匹配工具,可以用来搜索和修改文本,下面这篇文章主要给大家介绍了关于VSCode正则表达式匹配多行实战案例的相关资料,需要的朋友可以参考下
2024-03-03
javascript正则表达式简介
正则表达式就是一个用来描述字符模式的对象。它被用来在文本中执行模式匹配(pattern-matching)以及”查找-替换”(search-and-replace)的任务。javascript中正则的风格类似Perl中正则的风格。
2015-05-05
linux下关于正则表达式grep的一点总结
正则表达式（Regular Expression）是用于描述一组字符串特征的模式，用来匹配特定的字符串。通过特殊字符＋普通字符来进行模式描述，从而达到文本匹配目的工具
2020-04-04
Python如何使用正则表达式识别代码中的中文、英文和数字
正则表达式是一种强大的工具，可以帮助我们实现识别代码中的中文、英文和数字，本文将分三个部分详细介绍如何使用正则表达式在 Python 中识别代码中的中文、英文和数字，感兴趣的朋友跟随小编一起看看吧
2023-06-06
PBlog2 公用JS代码
PBlog2 公用JS代码...
2006-08-08
JavaScript replace new RegExp使用介绍
这篇文章主要介绍了JavaScript replace new RegExp使用介绍,需要的朋友可以参考下
2016-05-05
js正则表达式之search方法讲解
返回与正则表达式查找内容匹配的第一个子字符串的位置
2012-10-10
python实现统计汉字／英文单词数的正则表达式
一个简单的程序，统计文本文档中的单词和汉字数，逆序排列（出现频率高的排在最前面）python实现
2012-09-09

正则表达式不包含属性

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具