打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
正则表达式使用高级技巧之组的概念
正则表达式中的组是很重要的一个概念,它是我们通向高级正则应用的的桥梁。

组的概念

一个正则表达式匹配结果可以分成多个部分,这就是组(Group)的目的。能够灵活的使用组后,你会发现Regex真是很方便,也很强大。

先举个例子
  1. public static void Main()    
  2. {    
  3.  string s = "2005-2-21";    
  4.  Regex reg = new Regex(@"(?<y>\d{4})-(?<m>\d{1,2})-(?<d>\d{1,2})",RegexOptions.Compiled);    
  5.  Match match = reg.Match(s);    
  6.  int year = int.Parse(match.Groups["y"].Value);    
  7.  int month = int.Parse(match.Groups["m"].Value);    
  8.  int day = int .Parse(match.Groups["d"].Value);    
  9.  DateTime time = new DateTime(year,month,day);    
  10.  Console.WriteLine(time);    
  11.  Console.ReadLine();    
  12. }    
以上的例子通过组来实现分析一个字符串,并把其转化为一个DateTime实例,当然,这个功能用DateTime.Parse方法就能很方便的实现。

在这个例子中,我把一次Match结果用(?<name>)的方式分成三个组"y","m","d"分别代表年、月、日。

现在我们已经有了组的概念了,再来看如何分组,很简单的,除了上在的办法,我们可以用一对括号就定义出一个组,比如上例可以改成:
  1. public static void Main()    
  2. {    
  3.  string s = "2005-2-21";    
  4.  Regex reg = new Regex(@"(\d{4})-(\d{1,2})-(\d{1,2})",RegexOptions.Compiled);    
  5.  Match match = reg.Match(s);    
  6.  int year = int.Parse(match.Groups[1].Value);    
  7.  int month = int.Parse(match.Groups[2].Value);    
  8.  int day = int .Parse(match.Groups[3].Value);    
  9.  DateTime time = new DateTime(year,month,day);    
  10.  Console.WriteLine(time);    
  11.  Console.ReadLine();    
  12. }   
从上例可以看出,第一个括号对包涵的组被自动编号为1,后面的括号依次编号为2、3……
  1. public static void Main()    
  2. {    
  3.  string s = "2005-2-21";    
  4.  Regex reg = new Regex(@"(?<2>\d{4})-(?<1>\d{1,2})-(?<3>\d{1,2})",RegexOptions.Compiled);    
  5.  Match match = reg.Match(s);    
  6.  int year = int.Parse(match.Groups[2].Value);    
  7.  int month = int.Parse(match.Groups[1].Value);    
  8.  int day = int .Parse(match.Groups[3].Value);    
  9.  DateTime time = new DateTime(year,month,day);      
  10.  Console.WriteLine(time);    
  11.  Console.ReadLine();    
  12. }    
再看上例,我们用(?<数字>)的方式手工给每个括号对的组编号,(注意我定义1和2的位置时不是从左到右定义的)

通过以上三例,我们知道了给Regex定义Group的三种办法以及相应的引用组匹配结果的方式。

然后,关于组定义,还有两点请注意:

1、因为括号用于定义组了,所以如果要匹配"("和")",请使用"\("和"\)"(关于所有特殊字符的定义,请查看相关Regex expression帮助文档)。

2、如果定义Regex时,使用了ExplicitCapture选项,则第二个例子不会成功,因为此选项要求显式定义了编号或名字的组才捕获并保存结果,如果你没有定义ExplicitCapture选项,而有时又定义了类式于(A|B)这样的部分在表达式,而这个(A|B)你又并不想捕获结果,那么可以使用"不捕获的组"语法,即定义成(?:)的方式,针对于(A|B),你可以这样来定义以达到不捕获并保存它到Group集合中的目的--(?:A|B)。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
正则表达式之分组
正则表达式(二)
NET 正则表达式使用高级技巧之替换类介绍
正则表达式
一个很难的字符串问题
C#利用正则表达式实现字符串搜索
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服