全面認識Perl正則表達式使用
Perl正則表達式是Perl語言的一大特色,也是Perl程序中的一點難點,不過如果大家能夠很好的掌握他,就可以輕易地用Perl正則表達式來完成字符串處理的任務(wù),當(dāng)然在CGI程序設(shè)計中就更能得心應(yīng)手了。下面我們列出一些Perl正則表達式書寫時的一些基本語法規(guī)則。
Perl正則表達式
Perl正則表達式之元字符:
.匹配除\n外的任意一個字符
\轉(zhuǎn)義符
Perl正則表達式之量詞:
{3}匹配前一單元的三個*?{0,}?匹配前一單元的零個或多個
+?{1,}?匹配前一單元的一個或多個
??{0,1}?匹配前一單元的零個或一個
*{0,}匹配前一單元的多個或零個貪
+{1,}匹配前一單元的多個或一個貪
?{0,1}匹配前一單元的一個或零個貪
Perl正則表達式之編組:
()編組且觸發(fā)記憶(?:)編組但不觸發(fā)記憶Perl正則表達式之多個選擇:
Perl正則表達式之文法和算符優(yōu)先級:
'()','(?:)'>
'*','*?','+','+?','?','??','{}','{}?'>
''>
'|'
<regexp>-><regexp>'|'<concat>|<concat>
<concat>-><concat><repeat>|<repeat>
<repeat>-><repeat>('*'|'+'|'?'|'{'<int>'}')|<paren>
<paren>->'('<regexp>')'|'(?:'<regexp>')'|<char>
Perl正則表達式之字符類:
[abcwxyz]==[a-cw-z]
\d==[0-9]
\D==[^0-9]
\w==[a-zA-Z0-9_]
\W==[^a-zA-Z0-9_]
\s==[\f\t\n\r]
\S==[^\f\t\n\r]
Perl正則表達式之選項修飾符:
/i使匹配大小寫不敏感
/s使.匹配任意字符,包含'\n',等價于[\d\D]
/x允許Perl正則表達式中用空白和注釋來增強可讀性,空格文字和制表符文字等等將被忽略,只能用\s、\t等表示。/m匹配多行目標串時,改^和$的意義為行首錨和行尾錨
/g無重疊全局替換修飾符
Perl正則表達式之錨:
^串首錨
$串尾錨
\b單詞邊界錨參考\w
\B非單詞邊界錨
Perl正則表達式之綁定算子:
=~非賦值運算符也,綁定運算符也,It's曰ing:不處理$_了,處理我左邊的那個家伙Perl正則表達式插值:
雙引插值規(guī)則Perl正則表達式之匹配變量
()不僅用于Perl正則表達式的編組,也觸發(fā)匹配引擎的記憶,引擎會將整個匹配段中與括號內(nèi)Perl正則表達式對應(yīng)的那部分存入記憶體內(nèi)。自1編號,引用以$1,$2,...
記憶至下一次匹配成功時結(jié)束$&$MATCH整個匹配段
$`$PREMATCH匹配段之前的子串
$'$POSTMATCH匹配段之后的子串
Perl正則表達式舉例:
/^fred|barney$/要么以fred打頭,要么以barney結(jié)尾的串/^(fred|barney)$/
/(wilma|pebbles?)/
/^fred|barney$/m #p#
Perl正則表達式之文本處理替換:
分隔符規(guī)則:s#^https://#http://#;
s{fred}{barney};
s[fred](barney);
s<fred>#barney#;
綁定算子:=~
大小寫切換:\U此處起至\E全部大寫
\L此處起至\E全部小寫
\u下一個字母大寫
\l下一個字母小寫
舉例:s/(bush|mandola)/\u\L$1/ig
Perl正則表達式之split算子
語法:split/PATTERN/,EXPR,LIMIT
以/PATTERN/分割EXPR,最多分成LIMIT份若LIMIT省略且尾部為空串,則丟棄它若LIMIT為負值,則視其為無窮大EXPR缺省為$_
/PATTERN/缺省為/\s+/
Perl正則表達式之列表環(huán)境下的m//:返回引擎記憶體中的變量。
my$data="BarneyRubbleFredFlintstoneWilmaFlintstone";
my%last_name=($data=~/(\w+)\s+(\w+)/g);
my@arr=($data=~/(\w+)\s+(\w+)/g);
Perl正則表達式之匹配多行文本:
^和$普通模式下是串首錨和串尾錨,在/m(多行模式)下為行首錨和行尾錨
\A匹配串首,\Z匹配串尾
/^nat/m===/^nat|\nnat/
openFILE,$filename
ordie"Can'topen'$filename':$!";
my$lines=join'',<FILE>;
$lines=~s/^/$filename:/gm;
Perl正則表達式之更新多個文件:
鉆石符號<>的魔力:他會自動地為你打開和關(guān)閉在命令行指定的一系列文件,若命令行沒有指定任何文件名,他就打開標準輸入。$^I會改變<>的行為,若$^I不是undef,則<>會將文件重命名以"文件名".
"$^I",然后創(chuàng)建名為"文件名"的文件,然后打開重命名后的文件以讀,打開新建的文件以寫。
【編輯推薦】