当前位置: 首页 > news >正文

关于正则表达式的递归匹配问题

经常会有这样的需求,要求匹配出成对的小括号里的内容,

而一般正则表达式中的 ?R 的语法似乎在C#中不被支持, 在一番努力之下,终于找到以下一段描述

 

/(  应该是 \( 不是用 /转义而是用 \来转义

匹配嵌套的构造 
微软公司已经包含了一个有趣的创新来匹配稳定的构造(历史上,这是正则表达式所做不到的)。这并不容易掌握 — 尽管这节较短,但是注意,它非常的晦涩难懂。 
从一个例子开始可能更简单一些,所以我用这段代码作为开始: 
Regex r = new Regex(@"/((?>[^()]+|/((?<DEPTH>)|/)(?<-DEPTH>))*(?(DEPTH)(?!))/)"); 
这能匹配到首个完全配对的括号组,比如"before (nope (yes (here) okay) after"里面的"(yes (here) okay)"。注意第一个左括号没有被匹配到,因为没有和它匹配的右括号。 
下面是它如何运作的概览: 
1、在每个"("被匹配到的时候,"(?<DEPTH>)"在这里加上一,告诉正则表达式系统当前括号嵌套的深度( 正则表达式开头的"/("不包括在这里)。 
2、在每个")"被匹配到的时候,"(?<-DEPTH>)"从深度值内减一。 
3、"(?(DEPTH)(?!))"保证在匹配最后一个右括号之前深度为零。 
它能工作的原因在于引擎的回逆堆栈保存了匹配成功的组的轨迹。"(?<DEPTH>)"不过是一个带有名称的分组构造,它将总是匹配成功(不匹配任何东西)。而由于它被紧接着放在"/("之后,它的成功匹配(仍然在堆栈上直到被移除)被用于左括号的计数。 
译注:还有一种写法是"(?<DEPTH>/()",我个人比较喜欢这种形式,而不是"/((?<DEPTH>)"。后面的"/)(?<-DEPTH>)"也是一样。 
这样,匹配成功了的名为"DEPTH"的分组的计数在回逆堆栈上被建立起来。而当找到右括号的时候我们还希望从深度值减一,这是由.NET特别的语法构造"(?<-DEPTH>)"实现的,它将从堆栈上移除最近匹配的"DEPTH"分组。如果堆栈上已经没有记录,"(?<-DEPTH>)"分组匹配失败,从而防止了正则表达式系统匹配多余的右括号。 
最后,"(?(DEPTH)(?!))"是一个用于"(?!)"的断言,如果"DEPTH"分组到目前为止还是成功的话。如果当我们匹配到这里时还是成功的,这里有个未配对的左括号还没有被"(?<-DEPTH>)"移除。在这种情况,我们希望停止匹配(我们不希望匹配一个未配对的括号),所以我们使用"(?!)",它是一个“零宽度负预测先行断言”,仅当子表达式不在此位置的右侧匹配时才继续匹配。 
这就是在.NET的正则表达式实现中匹配嵌套结构的方法。
 

 

以上内容似乎很难懂, 其实如果觉的难懂的话也简单,那你就不要去理解,你只要能用就OK了,把() 替换成你要的字符,相信可以解决不少你的问题,

 

以下根据这个用法写了个测试用例

  1. private void button3_Click( object sender, EventArgs e )
  2. {
  3.        Regex r = new Regex( @"/[(?>[^/[/]]+|/[(?<DEPTH>)|/](?<-DEPTH>))*(?(DEPTH)(?!))/]" );
  4.        StringBuilder sb = new StringBuilder();
  5.        MatchString( "[111[222[333]]][222[333]][333]", r, sb );
  6.        MessageBox.Show( sb.ToString(), "取到的信息" );
  7. }
  8. private void MatchString( string OutString, Regex r, StringBuilder sb )
  9. {
  10.         MatchCollection ms = r.Matches( OutString );// 获取所有的匹配
  11.         foreach ( Match m in ms )
  12.         {
  13.                     if ( m.Success )
  14.                     {
  15.                              sb.AppendLine( m.Groups[0].Value );
  16.                              MatchString( m.Groups[0].Value.Substring( 1, m.Groups[0].Value.Length - 1 ), r, sb );// 去掉匹配到的头和尾的 "[" 和 "]",避免陷入死循环递归中,导致溢出
  17.                      }
  18.          }
  19.          return;
  20. }

可以得到

[111[222[333]]]  [222[333]]  [333]  [222[333]]  [333]  [333] 

相关文章:

  • js对象转json jsonStringify
  • 关于FileWriter的小细节
  • leetcode第一刷_Convert Sorted List to Binary Search Tree
  • Result Maps collection already contains value for
  • Ubuntu上Netbeans8.0字体的一次蛋疼体验
  • js 实现replaceAll
  • 性能测试结果分析(中级测试)
  • C++ 多线程入门1
  • OSGi Event Admin Service
  • jQuery ajax - post() 方法
  • 软件培训
  • 如何优化Mysql千万级快速分页
  • MySQL InnoDB体系结构
  • C++ 小复习
  • 在Linux中让echo命令显示带颜色的字
  • 【391天】每日项目总结系列128(2018.03.03)
  • 【跃迁之路】【699天】程序员高效学习方法论探索系列(实验阶段456-2019.1.19)...
  • ERLANG 网工修炼笔记 ---- UDP
  • HTTP 简介
  • java 多线程基础, 我觉得还是有必要看看的
  • React-redux的原理以及使用
  • 区块链将重新定义世界
  • 腾讯优测优分享 | Android碎片化问题小结——关于闪光灯的那些事儿
  • 想写好前端,先练好内功
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • (0)Nginx 功能特性
  • (一)使用Mybatis实现在student数据库中插入一个学生信息
  • (转)chrome浏览器收藏夹(书签)的导出与导入
  • (转)Oracle 9i 数据库设计指引全集(1)
  • *Django中的Ajax 纯js的书写样式1
  • .helper勒索病毒的最新威胁:如何恢复您的数据?
  • .NET MVC、 WebAPI、 WebService【ws】、NVVM、WCF、Remoting
  • .NET版Word处理控件Aspose.words功能演示:在ASP.NET MVC中创建MS Word编辑器
  • .NET设计模式(2):单件模式(Singleton Pattern)
  • .net中应用SQL缓存(实例使用)
  • @ConfigurationProperties注解对数据的自动封装
  • @Mapper作用
  • [AutoSar]BSW_Memory_Stack_003 NVM与APP的显式和隐式同步
  • [BROADCASTING]tensor的扩散机制
  • [C#]无法获取源 https://api.nuge t.org/v3-index存储签名信息解决方法
  • [CentOs7]iptables防火墙安装与设置
  • [COGS 622] [NOIP2011] 玛雅游戏 模拟
  • [DAX] MAX函数 | MAXX函数
  • [echarts] y轴不显示0
  • [flask]http请求//获取请求体数据
  • [GDMEC-无人机遥感研究小组]无人机遥感小组-000-数据集制备
  • [Go WebSocket] 多房间的聊天室(五)用多个小锁代替大锁,提高效率
  • [GPT]Andrej Karpathy微软Build大会GPT演讲(上)--GPT如何训练
  • [iOS]GCD(一)
  • [iOS]中字体样式设置 API
  • [JS入门到进阶] 前端开发不能写undefined?这是误区!
  • [LeetCode] NO. 169 Majority Element
  • [Mac软件]Boxy SVG 4.20.0 矢量图形编辑器
  • [MicroPython]TPYBoard v102 CAN总线通信
  • [NSSRound#16 Basic]RCE但是没有完全RCE