C#.NET regexp類
C#.NET還是比較常見的東西,這里我們主要介紹C#.NET regexp類,包括介紹基于過程和基于表達式方法的比較等方面。
多少年來,許多的編程語言和工具都包含對規(guī)則表達式的支持,.NET基礎類庫中包含有一個名字空間和一系列可以充分發(fā)揮規(guī)則表達式威力的類,而且它們也都與未來的Perl 5中的規(guī)則表達式兼容。
此外,C#.NET regexp類還能夠完成一些其他的功能,例如從右至左的結合模式和表達式的編輯等。
在這篇文章中,我將簡要地介紹System.Text.RegularExpression中的類和方法、一些字符串匹配和替換的例子以及組結構的詳細情況,***,還會介紹一些你可能會用到的常見的表達式。
應該掌握的基礎知識
規(guī)則表達式的知識可能是不少編程人員“常學常忘”的知識之一。在這篇文章中,我們將假定你已經(jīng)掌握了規(guī)則表達式的用法,尤其是Perl 5中表達式的用法。C#.NET regexp類是Perl 5中表達式的一個超集,因此,從理論上說它將作為一個很好的起點。我們還假設你具有了C#的語法和.NET架構的基本知識。
如果你沒有規(guī)則表達式方面的知識,我建議你從Perl 5的語法著手開始學習。在規(guī)則表達式方面的權威書籍是由杰弗里·弗雷德爾編寫的《掌握表達式》一書,對于希望深刻理解表達式的讀者,我們強烈建議閱讀這本書。
RegularExpression組合體
regexp規(guī)則類包含在System.Text.RegularExpressions.dll文件中,在對應用軟件進行編譯時你必須引用這個文件,例如,csc r:System.Text.RegularExpressions.dll foo.cs命令將創(chuàng)建foo.exe文件,它就引用了System.Text.RegularExpressions文件。
基于過程和基于表達式方法的比較
一般情況下,使用規(guī)則表達式的用戶可以分為以下二大類:***類用戶盡量不使用規(guī)則表達式,而是使用過程來執(zhí)行一些需要重復的操作;第二類用戶則充分利用規(guī)則表達式處理引擎的功能和威力,而盡可能少地使用過程。
對于我們大多數(shù)用戶而言,***的方案莫過于二者兼而用之了。我希望這篇文章能夠說明C#.NET regexp類的作用以及它在性能和復雜性之間的優(yōu)、劣點。
基于過程的模式
我們在編程中經(jīng)常需要用到的一個功能是對字符串中的一部分進行匹配或其他一些對字符串處理,下面是一個對字符串中的單詞進行匹配的例子:
- string text = "the quick red fox jumped over the lazy brown dog.";
- System.Console.WriteLine("text=[" + text + "]");
- string result = "";
- string pattern = @"\w+|\W+";
- foreach (Match m in Regex.Matches(text, pattern))
- {
- // 取得匹配的字符串
- string x = m.ToString();
- // 如果***個字符是小寫
- if (char.IsLower(x[0]))
- // 變成大寫
- x = char.ToUpper(x[0]) + x.Substring(1, x.Length-1);
- // 收集所有的字符
- result += x;
- }
- System.Console.WriteLine("result=[" + result + "]");
【編輯推薦】