C#正则表达式的递归匹配分析

 更新时间:2014年09月05日 09:14:51   投稿:shichen2014  
这篇文章主要介绍了C#正则表达式的递归匹配分析,针对C#程序的正则匹配方法,很有实用价值,需要的朋友可以参考下

在C#程序设计中经常会遇到这样的需求,要求匹配出成对的小括号里的内容,但是一般正则表达式中的 ?R 的语法似乎在C#中不被支持, 经过一番查找与测试,终于找到以下一段描述

/(  应该是 \( 不是用 /转义而是用 \来转义

匹配嵌套的构造

微软公司已经包含了一个有趣的创新来匹配稳定的构造(历史上,这是正则表达式所做不到的)。这并不容易掌握 — 尽管这节较短,但是注意,它非常的晦涩难懂。
从一个例子开始可能更简单一些,所以我用这段代码作为开始:

Regex r = new Regex(@"/((?>[^()]+|/((?<DEPTH>)|/)(?<-DEPTH>))*(?(DEPTH)(?!))/)"); 

这能匹配到首个完全配对的括号组,比如"before (nope (yes (here) okay) after"里面的"(yes (here) okay)"。注意第一个左括号没有被匹配到,因为没有和它匹配的右括号。

下面是它如何运作的概览:

1、在每个"("被匹配到的时候,"(?<DEPTH>)"在这里加上一,告诉正则表达式系统当前括号嵌套的深度( 正则表达式开头的"/("不包括在这里)。

2、在每个")"被匹配到的时候,"(?<-DEPTH>)"从深度值内减一。

3、"(?(DEPTH)(?!))"保证在匹配最后一个右括号之前深度为零。

它能工作的原因在于引擎的回逆堆栈保存了匹配成功的组的轨迹。"(?<DEPTH>)"不过是一个带有名称的分组构造,它将总是匹配成功(不匹配任何东西)。而由于它被紧接着放在"/("之后,它的成功匹配(仍然在堆栈上直到被移除)被用于左括号的计数。

译注:还有一种写法是"(?<DEPTH>/()",我个人比较喜欢这种形式,而不是"/((?<DEPTH>)"。后面的"/)(?<-DEPTH>)"也是一样。

这样,匹配成功了的名为"DEPTH"的分组的计数在回逆堆栈上被建立起来。而当找到右括号的时候我们还希望从深度值减一,这是由.NET特别的语法构造"(?<-DEPTH>)"实现的,它将从堆栈上移除最近匹配的"DEPTH"分组。如果堆栈上已经没有记录,"(?<-DEPTH>)"分组匹配失败,从而防止了正则表达式系统匹配多余的右括号。

最后,"(?(DEPTH)(?!))"是一个用于"(?!)"的断言,如果"DEPTH"分组到目前为止还是成功的话。如果当我们匹配到这里时还是成功的,这里有个未配对的左括号还没有被"(?<-DEPTH>)"移除。在这种情况,我们希望停止匹配(我们不希望匹配一个未配对的括号),所以我们使用"(?!)",它是一个“零宽度负预测先行断言”,仅当子表达式不在此位置的右侧匹配时才继续匹配。
这就是在.NET的正则表达式实现中匹配嵌套结构的方法。

以上内容似乎很难懂, 其实如果觉的难懂的话也简单,那你就不要去理解,你只要能用就OK了,把() 替换成你要的字符,相信可以解决不少你的问题,

以下根据这个用法写了个测试用例

private void button3_Click( object sender, EventArgs e )
{
    Regex r = new Regex( @"/[(?>[^/[/]]+|/[(?<DEPTH>)|/](?<-DEPTH>))*(?(DEPTH)(?!))/]" );
    StringBuilder sb = new StringBuilder();
    MatchString( "[111[222[333]]][222[333]][333]", r, sb );
    MessageBox.Show( sb.ToString(), "取到的信息" );
}
private void MatchString( string OutString, Regex r, StringBuilder sb )
{
    MatchCollection ms = r.Matches( OutString );// 获取所有的匹配
    foreach ( Match m in ms )
    {
          if ( m.Success )
          {
               sb.AppendLine( m.Groups[0].Value );
               MatchString( m.Groups[0].Value.Substring( 1, m.Groups[0].Value.Length - 1 ), r, sb );// 去掉匹配到的头和尾的 "[" 和 "]",避免陷入死循环递归中,导致溢出
           }
     }
     return;
}

可以得到

[111[222[333]]] [222[333]] [333] [222[333]] [333] [333] 

相信本文所述对大家的C#程序设计有一定的借鉴价值。

相关文章

  • C# wpf Grid中实现控件拖动调整大小的示例代码

    C# wpf Grid中实现控件拖动调整大小的示例代码

    本文主要介绍了C# wpf Grid中实现控件拖动调整大小的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • C#实现WebSocket协议客户端和服务器websocket sharp组件实例解析

    C#实现WebSocket协议客户端和服务器websocket sharp组件实例解析

    这篇文章主要介绍了C#实现WebSocket协议客户端和服务器websocket sharp组件实例解析,包括websocket sharp组件的概念及使用方法,需要的朋友可以参考下
    2017-04-04
  • Unity游戏开发之炸弹人游戏的实现

    Unity游戏开发之炸弹人游戏的实现

    大家小时候肯定玩过这款游戏,炸弹人也算是经典中的经典啦。本文将利用Unity模拟实现这一经典游戏,感兴趣的小伙伴可以跟随小编一起学习一下
    2022-03-03
  • C#实现图形位置组合转换的方法

    C#实现图形位置组合转换的方法

    这篇文章主要介绍了C#实现图形位置组合转换的方法,涉及C#使用Matrix操作图形的相关技巧,需要的朋友可以参考下
    2015-06-06
  • C#加锁防止并发的几种方法详解

    C#加锁防止并发的几种方法详解

    文章介绍了C#中多种加锁方式,包括lock、Monitor、SemaphoreSlim、Mutex、ReaderWriterLockSlim、Concurrent集合、Redis分布式锁,以及在实际工作中的应用和注意事项,感兴趣的朋友一起看看吧
    2025-03-03
  • C#控制图像旋转和翻转的方法

    C#控制图像旋转和翻转的方法

    这篇文章主要介绍了C#控制图像旋转和翻转的方法,涉及C#图像操作中RotateFlip方法的相关使用技巧,需要的朋友可以参考下
    2015-06-06
  • C#网络爬虫代码分享 C#简单的爬取工具

    C#网络爬虫代码分享 C#简单的爬取工具

    这篇文章主要为大家详细介绍了C#网络爬虫代码,教大家如何制作了简单的爬取工具,感兴趣的小伙伴们可以参考一下
    2016-07-07
  • Asp.Net中避免重复提交和弹出提示框的实例代码

    Asp.Net中避免重复提交和弹出提示框的实例代码

    本文分为前台和后台代码实现避免重复提交和弹出提示框效果,代码简单易懂,非常不错,具有参考借鉴价值,需要的的朋友参考下
    2017-02-02
  • C#泛型详解及关键字作用

    C#泛型详解及关键字作用

    这篇文章主要来讲讲c#中的泛型,因为泛型在c#中有很重要的位置,对于写出高可读性,高性能的代码有着关键的作用,大家都知道泛型公共语言运行库是非常重要功能,那么为什么使用泛型呢,带着这个问题一起通过本文学习下吧
    2021-08-08
  • 通过C#实现在Word中插入或删除分节符

    通过C#实现在Word中插入或删除分节符

    在Word中,分节符是一种强大的工具,用于将文档分成不同的部分,每个部分可以有独立的页面设置,如页边距、纸张方向、页眉和页脚等,本文将介绍如何使用一个免费的.NET库通过C#实现插入或删除Word分节符,需要的朋友可以参考下
    2024-08-08

最新评论