C#中正则表达式的3种匹配模式

 更新时间:2016年05月05日 09:15:06   作者:波波  
本文主要介绍在C#中正则匹配的三种模式:单行模式(Singleline)、多行模式(Multiline)与忽略大小写(IgnoreCase),希望能帮到大家。

在C#中,我们一般使用Regex类来表示一个正则表达式。一般正则表达式引擎支持以下3种匹配模式:单行模式(Singleline)、多行模式(Multiline)与忽略大小写(IgnoreCase)。

1. 单行模式(Singleline)
MSDN定义:更改点 (.) 的含义,使它与每一个字符匹配(而不是与除 \n 之外的每个字符匹配)。
使用单行模式的典型场景是获取网页源码中的信息。

示例:

我们使用WebBrowser控件,从http://www.xxx.com/1.htm上获取了如下HTML源码,它存储在变量str中:

<html>
<body>
<div>
Line 1
Line 2
</div>
</body>
</html>

我们想把div标签以及其中的内容提取出来,编写代码如下:

string pattern = @"<div>.*</div>";
Regex regex = new Regex(pattern);
if (regex.IsMatch(str))
  Console.WriteLine(regex.Match(str).Value);
else
  Console.WriteLine("Mismatch!");

//结果为:Mismatch!

错误分析:

一般认为点符号(.)是匹配任意单个字符的,而(.*)就是匹配任意多个字符。但实际上点符号不能匹配换行符。在Windows中与它等效的表达式为[^\r\n]。
而我们从网站上获取的HTML源码,极少有不换行的。这时候单行模式派上用场了,它可以改变点符号的意义。修改regex实例的构造函数,用RegexOptions.Singleline来声明使用单行模式:

string pattern = @"<div>.*</div>";
Regex regex = new Regex(pattern, RegexOptions.Singleline);
if (regex.IsMatch(str))
  Console.WriteLine(regex.Match(str).Value);
else
  Console.WriteLine("Mismatch!");

/*
结果为:
<div>
Line 1
Line 2
</div>
*/

单行模式的嵌入修饰符:

我们可以直接在正则表达式中嵌入单行模式:

(?s)<div>.*</div>

(?s)修饰符说明,其后面的表达式采用单行模式。所以使用时请不要将它放在末尾。另外可以使用(?-s)关闭单行模式。

注意:嵌入模式的优先级要高于Regex类的RegexOptions设置,所以使用了(?s)后,无论是否使用RegexOptions.Singleline,均按照单行模式解析。

2. 多行模式(Multiline)

MSDN定义:更改 ^ 和 $ 的含义,使它们分别在任意一行的行首和行尾匹配,而不仅仅在整个字符串的开头和结尾匹配。

示例:

有一个文本文件,它的每一行是一个用户名,将文件读入变量str中进行处理。其内容如下:

二十四画生
TerryLee
莫相会
Dflying Chen
Rainy

借用博客园各位前辈的大名:)

我们想找出一个使用英文字母开头的用户名,编写代码如下:

string pattern = @"^[A-Za-z]+.*";
Regex regex = new Regex(pattern);
if (regex.IsMatch(str))
  Console.WriteLine(regex.Match(str).Value);
else
  Console.WriteLine("Mismatch!");

//结果为:Mismatch!

错误分析:

(^)是字符串的起始锚定,str的第一个字符是一个中文字,所以匹配不上。我们就可以使用多行模式来改变(^)的含义,使它匹配每一行的起始,而不是整个字符串的起始。

更改代码如下:

string pattern = @"^[A-Za-z]+.*";
Regex regex = new Regex(pattern, RegexOptions.Multiline);
if (regex.IsMatch(str))
  Console.WriteLine(regex.Match(str).Value);
else
  Console.WriteLine("Mismatch!");

//结果为:TerryLee

同时,多行模式也会改变($)的含义,使它匹配每一行的结尾,而不是整个字符串的结尾。

与(^)和($)不同的是,(\A)和(\Z)并不受多行模式的影响,永远匹配整个字符串的起始和结尾。

多行模式的嵌入修饰符:(?m)与(?-m)

3. 忽略大小写(IgnoreCase)

MSDN定义:指定不区分大小写的匹配。

这个模式很容易理解,它认为大小写字符是相同的。我们仍以上例来说明。

示例:

string pattern = @"^[a-z]+.*";
Regex regex = new Regex(pattern, RegexOptions.Multiline | RegexOptions.IgnoreCase);
if (regex.IsMatch(str))
  Console.WriteLine(regex.Match(str).Value);
else
  Console.WriteLine("Mismatch!");

//结果为:TerryLee

分析:请注意这次使用的正则表达式,我们并没有写入大写字母,但却匹配了以大写字母开头的名字,这就是忽略大小写的效果。

忽略大小写的嵌入修饰符:(?i)与(?-i)

总结:

最后我们用一个表格来总结一下这三个模式

定义 影响的表达式 RegexOptions枚举 嵌入标识符
单行模式 更改点 (.) 的含义,使它与每一个字符匹配(而不是与除 \n 之外的每个字符匹配)。 Singleline (?s)
多行模式 更改 ^ 和 $ 的含义,使它们分别在任意一行的行首和行尾匹配,而不仅仅在整个字符串的开头和结尾匹配。 Multiline (?m)
忽略大小写 指定不区分大小写的匹配。 IgnoreCase (?i)

相关文章

  • C#中Equals方法的常见误解

    C#中Equals方法的常见误解

    equals方法被用来检测两个对象是否相等,即两个对象的内容是否相等。本文主要介绍的是equals方法,初学者对它几个常见的误解,一起来看。
    2015-10-10
  • Unity的AssetPostprocessor之Model函数使用实战

    Unity的AssetPostprocessor之Model函数使用实战

    这篇文章主要为大家介绍了Unity的AssetPostprocessor之Model函数使用实战,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-08-08
  • 深入讲解C#编程中嵌套类型和匿名类型的定义与使用

    深入讲解C#编程中嵌套类型和匿名类型的定义与使用

    这篇文章主要介绍了C#编程中嵌套类型和匿名类型的定义与使用,包括在SQL语句中使用匿名类型的方法,需要的朋友可以参考下
    2016-01-01
  • C#深拷贝方法探究及性能比较(多种深拷贝)

    C#深拷贝方法探究及性能比较(多种深拷贝)

    这篇文章主要介绍了C#中使用NetCDF存储二维数据的读写操作简单应用,探究了以下几种C#对象深拷贝方式,同时简单对比了以下列出的几种深拷贝方式的速度,需要的朋友可以参考下
    2022-04-04
  • C#开发纽曼USB来电小秘书客户端总结

    C#开发纽曼USB来电小秘书客户端总结

    这篇文章主要介绍了C#开发纽曼USB来电小秘书客户端总结,对于C#项目开发来说有一定的参考借鉴价值,需要的朋友可以参考下
    2014-08-08
  • c#中单例类与静态类的区别以及使用场景

    c#中单例类与静态类的区别以及使用场景

    这篇文章主要给大家介绍了关于c#中单例类与静态类的区别以及使用场景的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • c#预处理指令分析

    c#预处理指令分析

    这篇文章主要介绍了c#预处理指令的相关资料,帮助大家更好的理解和学习c#,感兴趣的朋友可以了解下
    2020-08-08
  • Unity实现QQ列表折叠菜单

    Unity实现QQ列表折叠菜单

    这篇文章主要为大家详细介绍了Unity实现QQ列表折叠菜单,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-04-04
  • Entity Framework主从表的增删改

    Entity Framework主从表的增删改

    这篇文章介绍了Entity Framework主从表的增删改,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-06-06
  • C#如何使用Task类解决线程的等待问题

    C#如何使用Task类解决线程的等待问题

    这篇文章主要介绍了C#如何使用Task类解决线程的等待问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-06-06

最新评论