追溯Perl正則表達(dá)式的起源和使用
本文和大家重點討論一下Perl正則表達(dá)式的概念,主要包括Perl正則表達(dá)式起源和使用兩大部分內(nèi)容,相信通過本文的學(xué)習(xí)你對Perl正則表達(dá)式會有全面的了解。
Perl正則表達(dá)式簡介
1.Perl正則表達(dá)式
如果原來沒有使用過Perl正則表達(dá)式,那么可能對這個術(shù)語和概念會不太熟悉。不過,它們并不是您想象的那么新奇。
請回想一下在硬盤上是如何查找文件的。您肯定會使用?和*字符來幫助查找您正尋找的文件。?字符匹配文件名中的單個字符,而*則匹配一個或多個字符。一個如'data?.dat'的模式可以找到下述文件:
data1.dat
data2.dat
datax.dat
dataN.dat
如果使用*字符代替?字符,則將擴大找到的文件數(shù)量。'data*.dat'可以匹配下述所有文件名:
data.dat
data1.dat
data2.dat
data12.dat
datax.dat
dataXYZ.dat
盡管這種搜索文件的方法肯定很有用,但也十分有限。?和*通配符的有限能力可以使你對Perl正則表達(dá)式能做什么有一個概念,不過Perl正則表達(dá)式的功能更強大,也更靈活。
-------------------------------------------------------
2.早期起源
早期起源
Perl正則表達(dá)式的“祖先”可以一直上溯至對人類神經(jīng)系統(tǒng)如何工作的早期研究。WarrenMcCulloch和WalterPitts這兩位神經(jīng)生理學(xué)家研究出一種數(shù)學(xué)方式來描述這些神經(jīng)網(wǎng)絡(luò)。
1956年,一位叫StephenKleene的美國數(shù)學(xué)家在McCulloch和Pitts早期工作的基礎(chǔ)上,發(fā)表了一篇標(biāo)題為“神經(jīng)網(wǎng)事件的表示法”的論文,引入了Perl正則表達(dá)式的概念。Perl正則表達(dá)式就是用來描述他稱為“正則集的代數(shù)”的表達(dá)式,因此采用“Perl正則表達(dá)式”這個術(shù)語。
隨后,發(fā)現(xiàn)可以將這一工作應(yīng)用于使用KenThompson的計算搜索算法的一些早期研究,KenThompson是Unix的主要發(fā)明人。Perl正則表達(dá)式的***個實用應(yīng)用程序就是Unix中的qed編輯器。
如他們所說,剩下的就是眾所周知的歷史了。從那時起直至現(xiàn)在Perl正則表達(dá)式都是基于文本的編輯器和搜索工具中的一個重要部分。
--------------------------------------------------------
3.使用Perl正則表達(dá)式
在典型的搜索和替換操作中,必須提供要查找的確切文字。這種技術(shù)對于靜態(tài)文本中的簡單搜索和替換任務(wù)可能足夠了,但是由于它缺乏靈活性,因此在搜索動態(tài)文本時就有困難了,甚至是不可能的。
使用Perl正則表達(dá)式,就可以:
1.測試字符串的某個模式。例如,可以對一個輸入字符串進(jìn)行測試,看在該字符串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱為數(shù)據(jù)有效性驗證。
2.替換文本??梢栽谖臋n中使用一個Perl正則表達(dá)式來標(biāo)識特定文字,然后可以全部將其刪除,或者替換為別的文字。
3.根據(jù)模式匹配從字符串中提取一個子字符串。可以用來在文本或輸入字段中查找特定文字。
例如,如果需要搜索整個web站點來刪除某些過時的材料并替換某些HTML格式化標(biāo)記,則可以使用Perl正則表達(dá)式對每個文件進(jìn)行測試,看在該文件中是否存在所要查找的材料或HTML格式化標(biāo)記。用這個方法,就可以將受影響的文件范圍縮小到包含要刪除或更改的材料的那些文件。然后可以使用Perl正則表達(dá)式來刪除過時的材料,***,可以再次使用Perl正則表達(dá)式來查找并替換那些需要替換的標(biāo)記。
另一個說明Perl正則表達(dá)式非常有用的示例是一種其字符串處理能力還不為人所知的語言。VBScript是VisualBasic的一個子集,具有豐富的字符串處理功能。與C類似的VisualBasicScriptingEdition則沒有這一能力。Perl正則表達(dá)式給VisualBasicScriptingEdition的字符串處理能力帶來了明顯改善。不過,可能還是在VBScript中使用Perl正則表達(dá)式的
效率更高,它允許在單個表達(dá)式中執(zhí)行多個字符串操作。
本篇文章來自<A>IDC專家網(wǎng)</a>原文鏈接:http://www.soidc.net/articles/1213781277395/20000824/1215945421383_1.html
【編輯推薦】