最常用的PHP正則表達式收集整理

2020-03-16 21:19:16

字體：大中小

來源：轉載

供稿：網友

正則表達式用于字符串處理、表單驗證等場合，實用高效。本文收集了一些常用的表達式：

PHP代碼
$str = preg_replace("/(<a.*?>)(.*?)(<//a>)/", '/1<span class="link">/2</span>/3', $str);
其中用了三個子模式（每個圓括號中內容為一個子模式），第一個是鏈接開始標簽，第二個是鏈接文本，第三個是</a>

然后第二個參數中/1、/2、/3就表示這三個部分，要替換成什么樣子還不簡單？

獲取頁面中的所有鏈接地址的PHP函數

下面這個用PHP寫的函數,可以獲取任意的字符串$string中的所有鏈接地址($string可以是從一個HTML頁面文件直接讀取出來的字符串),結果保存在一個數組中返回.該函數自動把電子郵件地址排除在外,而且返回的數組中不會有重復元素.

復制代碼代碼如下:

		
		function GetAllLink($string) 
		{ 
		$string = str_replace("/r","",$string); 
		$string = str_replace("/n","",$string); 
		
		$regex[url] = "((http|https|ftp|telnet|news):////)?([a-z0-9_/-///.]+/.[][a-z0-9:;&#@=_~%/?///./,/+/-]+)"; 
		$regex[email] = "([a-z0-9_/-]+)@([a-z0-9_/-]+/.[a-z0-9/-/._/-]+)"; 
		
		//去掉標簽之間的文字 
		$string = eregi_replace(">[^<>]+<","><", $string); 
		
		//去掉JAVASCRIPT代碼 
		$string = eregi_replace("<!--.*//-->","", $string); 
		
		//去掉非<a>的HTML標簽 
		$string = eregi_replace("<[^a][^<>]*>","", $string); 
		
		//去掉EMAIL鏈接 
		$string = eregi_replace("<a([ ]+)href=([/"']*)mailto:($regex[email])([/"']*)[^>]*>","", $string); 
		
		//替換需要的網頁鏈接 
		$string = eregi_replace("<a([ ]+)href=([/"']*)($regex[url])([/"']*)[^>]*>","//3/t", $string); 
		
		$output[0] = strtok($string, "/t"); 
		while(($temp = strtok("/t"))) 
		{ 
		if($temp && !in_array($temp, $output)) 
		$output[++$i] = $temp; 
		} 
		
		return $output; 
		} 

以下是以PHP的語法所寫的示例
驗證字符串是否只含數字與英文，字符串長度并在4~16個字符之間

復制代碼代碼如下:

		
		<?php 
		$str = 'a1234'; 
		if (preg_match("^[a-zA-Z0-9]{4,16}$", $str)) { 
		echo "驗證成功";} else { 
		echo "驗證失敗";}?> 

簡易的臺灣身分證字號驗證

復制代碼代碼如下:

		
		<?php 
		$str = 'a1234'; 
		if (preg_match("^(?:/d{15}|/d{18})$", $str)) { 
		echo "驗證成功"; 
		} else { 
		echo "驗證失敗";} 
		?> 

下面的代碼實現文字中的代碼塊，功能就如你在武林網看到的代碼一樣。

復制代碼代碼如下:

		
		function codedisp($code) { 
		global $discuzcodes; 
		$discuzcodes['pcodecount']++; 
		$code = htmlspecialchars(str_replace('//"', '"', preg_replace("/^[/n/r]*(.+?)[/n/r]*$/is", "//1", $code))); 
		$discuzcodes['codehtml'][$discuzcodes['pcodecount']] = "<br><div class=/"msgheader/"><div class=/"right/"><a href=/"###/" class=/"smalltxt/" onclick=/"copycode($('phpcode$discuzcodes[codecount]'));/">[復制此代碼]</a></div>代碼如下:</div><div class=/"msgborder/" id=/"phpcode$discuzcodes[codecount]/">".fhtml2($code)."</div><br>"; 
		$discuzcodes['codecount']++; 
		return "[/tDISCUZ_CODE_$discuzcodes[pcodecount]/t]"; 
		} 
		$message = preg_replace("//s*/[code/](.+?)/[//code/]/s*/ies", "codedisp('//1')", $message); 
		$message = preg_replace("//s*/[html/](.+?)/[//html/]/s*/ies", "htmldisp('//1')", $message); 

匹配中文字符的正則表達式： [/u4e00-/u9fa5]
評注：匹配中文還真是個頭疼的事，有了這個表達式就好辦了
匹配雙字節字符(包括漢字在內)：[^/x00-/xff]
評注：可以用來計算字符串的長度（一個雙字節字符長度計2，ASCII字符計1）
匹配空白行的正則表達式：/n/s*/r
評注：可以用來刪除空白行
匹配HTML標記的正則表達式：<(/S*?)[^>]*>.*?<//1>|<.*? />
評注：網上流傳的版本太糟糕，上面這個也僅僅能匹配部分，對于復雜的嵌套標記依舊無能為力
匹配首尾空白字符的正則表達式：^/s*|/s*$
評注：可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等)，非常有用的表達式
匹配Email地址的正則表達式：/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*
評注：表單驗證時很實用
匹配網址URL的正則表達式：[a-zA-z]+://[^/s]*
評注：網上流傳的版本功能很有限，上面這個基本可以滿足需求
匹配帳號是否合法(字母開頭，允許5-16字節，允許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評注：表單驗證時很實用
匹配國內電話號碼：/d{3}-/d{8}|/d{4}-/d{7}
評注：匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號：[1-9][0-9]{4,}
評注：騰訊QQ號從10000開始
匹配中國郵政編碼：[1-9]/d{5}(?!/d)
評注：中國郵政編碼為6位數字
匹配身份證：/d{15}|/d{18}
評注：中國的身份證為15位或18位
匹配ip地址：/d+/./d+/./d+/./d+
評注：提取ip地址時有用
匹配特定數字：
^[1-9]/d*$　　 //匹配正整數
^-[1-9]/d*$ 　 //匹配負整數
^-?[1-9]/d*$　　 //匹配整數
^[1-9]/d*|0$　 //匹配非負整數（正整數 + 0）
^-[1-9]/d*|0$　　 //匹配非正整數（負整數 + 0）
^[1-9]/d*/./d*|0/./d*[1-9]/d*$　　 //匹配正浮點數
^-([1-9]/d*/./d*|0/./d*[1-9]/d*)$　 //匹配負浮點數
^-?([1-9]/d*/./d*|0/./d*[1-9]/d*|0?/.0+|0)$　 //匹配浮點數
^[1-9]/d*/./d*|0/./d*[1-9]/d*|0?/.0+|0$　　 //匹配非負浮點數（正浮點數 + 0）
^(-([1-9]/d*/./d*|0/./d*[1-9]/d*))|0?/.0+|0$　　//匹配非正浮點數（負浮點數 + 0）
評注：處理大量數據時有用，具體應用時注意修正
匹配特定字符串：
^[A-Za-z]+$　　//匹配由26個英文字母組成的字符串
^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字符串
^[a-z]+$　　//匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$　　//匹配由數字和26個英文字母組成的字符串
^/w+$　　//匹配由數字、26個英文字母或者下劃線組成的字符串

下面是一些特殊字符：
正則表達式中的特殊字符：（學習參考書－＜＜精通正則表達式＞＞）
字符
意義：對于字符，通常表示按字面意義，指出接著的字符為特殊字符，不作解釋。
例如：/b/匹配字符'b',通過在b 前面加一個反斜杠，也就是/b/，則該字符變成特殊字符，表示
匹配一個單詞的分界線。
或者：
對于幾個字符，通常說明是特殊的，指出緊接著的字符不是特殊的，而應該按字面解釋。
例如：*是一個特殊字符，匹配任意個字符(包括0個字符)；例如：/a*/意味匹配0個或多個a。
為了匹配字面上的*，在a前面加一個反斜杠；例如：/a*/匹配'a*'。

字符^
意義：表示匹配的字符必須在最前邊。
例如：/^A/不匹配"an A,"中的'A'，但匹配"An A."中最前面的'A'。

字符$
意義：與^類似，匹配最末的字符。
例如：/t$/不匹配"eater"中的't'，但匹配"eat"中的't'。

字符*
意義：匹配*前面的字符0次或n次。
例如:/bo*/匹配"A ghost booooed"中的'boooo'或"A bird warbled"中的'b'，但不匹配"A goat g
runted"中的任何字符。

字符+
意義：匹配+號前面的字符1次或n次。等價于{1,}。
例如：/a+/匹配"candy"中的'a'和"caaaaaaandy."中的所有'a'。

字符?
意義：匹配?前面的字符0次或1次。
例如：/e?le?/匹配"angel"中的'el'和"angle."中的'le'。

字符.
意義：(小數點)匹配除換行符外的所有單個的字符。
例如：/.n/匹配"nay, an apple is on the tree"中的'an'和'on'，但不匹配'nay'。

字符(x)
意義：匹配'x'并記錄匹配的值。
例如：/(foo)/匹配和記錄"foo bar."中的'foo'。匹配子串能被結果數組中的素[1], ..., [n] 返
回，或被RegExp對象的屬性$1, ..., $9返回。

字符x|y
意義：匹配'x'或者'y'。
例如：/green|red/匹配"green apple"中的'green'和"red apple."中的'red'。

字符{n}
意義：這里的n是一個正整數。匹配前面的n個字符。
例如：/a{2}/不匹配"candy,"中的'a'，但匹配"caandy," 中的所有'a'和"caaandy."中前面的兩個
'a'。

字符{n,}
意義：這里的n是一個正整數。匹配至少n個前面的字符。
例如：/a{2,}不匹配"candy"中的'a'，但匹配"caandy"中的所有'a'和"caaaaaaandy."中的所有'a'

字符{n,m}
意義：這里的n和m都是正整數。匹配至少n個最多m個前面的字符。
例如：/a{1,3}/不匹配"cndy"中的任何字符，但匹配 "candy,"中的'a'，"caandy," 中的前面兩個
'a'和"caaaaaaandy"中前面的三個'a'，注意：即使"caaaaaaandy" 中有很多個'a'，但只匹配前面的三
個'a'即"aaa"。

字符[xyz]
意義：一字符列表，匹配列出中的任一字符。你可以通過連字符-指出一個字符范圍。
例如：[abcd]跟[a-c]一樣。它們匹配"brisket"中的'b'和"ache"中的'c'。

字符[^xyz]
意義：一字符補集，也就是說，它匹配除了列出的字符外的所有東西。你可以使用連字符-指出一
字符范圍。
例如：[^abc]和[^a-c]等價，它們最早匹配"brisket"中的'r'和"chop."中的'h'。

字符
意義：匹配一個空格(不要與b混淆)

字符b
意義：匹配一個單詞的分界線，比如一個空格(不要與混淆)
例如：/bnw/匹配"noonday"中的'no'，/wyb/匹配"possibly yesterday."中的'ly'。

字符B
意義：匹配一個單詞的非分界線
例如：/wBn/匹配"noonday"中的'on'，/yBw/匹配"possibly yesterday."中的'ye'。

字符cX
意義：這里的X是一個控制字符。匹配一個字符串的控制字符。
例如：/cM/匹配一個字符串中的control-M。

字符d
意義：匹配一個數字，等價于[0-9]。
例如：/d/或/[0-9]/匹配"B2 is the suite number."中的'2'。

字符D
意義：匹配任何的非數字，等價于[^0-9]。
例如：/D/或/[^0-9]/匹配"B2 is the suite number."中的'B'。

字符f
意義：匹配一個表單符

字符n
意義：匹配一個換行符

字符r
意義：匹配一個回車符

字符s
意義：匹配一個單個white空格符，包括空格，tab，form feed，換行符，等價于[ fnrtv]。
例如：/sw*/匹配"foo bar."中的' bar'。

字符S
意義：匹配除white空格符以外的一個單個的字符，等價于[^ fnrtv]。
例如：/S/w*匹配"foo bar."中的'foo'。

字符t
意義：匹配一個制表符

字符v
意義：匹配一個頂頭制表符

字符w
意義：匹配所有的數字和字母以及下劃線，等價于[A-Za-z0-9_]。
例如：/w/匹配"apple,"中的'a'，"$5.28,"中的'5'和"3D."中的'3'。

字符W
意義：匹配除數字、字母外及下劃線外的其它字符，等價于[^A-Za-z0-9_]。
例如：/W/或者/[^$A-Za-z0-9_]/匹配"50%."中的'%'。

字符n
意義：這里的n是一個正整數。匹配一個正則表達式的最后一個子串的n的值(計數左圓括號)。

例如：/apple(,)sorange1/匹配"apple, orange, cherry, peach."中的'apple, orange'，下面
有一個更加完整的例子。
注意：如果左圓括號中的數字比n指定的數字還小，則n取下一行的八進制escape作為描述。

字符ooctal和xhex
意義：這里的ooctal是一個八進制的escape值，而xhex是一個十六進制的escape值，允許在一個正則表達式中嵌入ASCII碼。

通用模式

定界符，通常使用 "/"做為定界符開始和結束,也可以使用"#"。
　　什么時候使用"#"呢?一般是在你的字符串中有很多"/"字符的時候，因為正則的時候這種字符需要轉義，比如uri。
使用"/"定界符的代碼如下.

復制代碼代碼如下:

		
		<?php 
		$regex = '/^http://([w.]+)/([w]+)/([w]+).html$/i'; 
		$str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; 
		$matches = array(); 
		if(preg_match($regex, $str, $matches)){ 
		var_dump($matches); 
		} 
		echo "n"; 

preg_match中的$matches[0]將包含與整個模式匹配的字符串。
使用"#"定界符的代碼如下.這個時候對"/"就不轉義!

復制代碼代碼如下:

		
		$regex = '#^http://([w.]+)/([w]+)/([w]+).html$#i'; 
		$str = 'http://www.youku.com/show_page/id_ABCDEFG.html'; 
		$matches = array(); 
		if(preg_match($regex, $str, $matches)){ 
		var_dump($matches); 
		} 
		echo "n"; 

修飾符:用于改變正則表達式的行為。
我們看到的('/^http://([w.]+)/([w]+)/([w]+).html/i')中的最后一個"i"就是修飾符,表示忽略大小寫，還有一個我們經常用到的是"x"表示忽略空格。
貢獻代碼:

復制代碼代碼如下:

		
		$regex = '/HELLO/'; 
		$str = 'hello word'; 
		$matches = array(); 
		if(preg_match($regex, $str, $matches)){ 
		echo 'No i:Valid Successful!',"n"; 
		} 
		if(preg_match($regex.'i', $str, $matches)){ 
		echo 'YES i:Valid Successful!',"n"; 
		} 

字符域:[w]用方括號擴起來的部分就是字符域。

限定符:如[w]{3,5}或者[w]*或者[w]+這些[w]后面的符號都表示限定符。現介紹具體意義。
{3,5}表示3到5個字符。{3,}超過3個字符，{,5}最多5個，{3}三個字符。
* 表示0到多個
+ 表示1到多個。
脫字符號
^:
> 放在字符域(如:[^w])中表示否定(不包括的意思)——“反向選擇”
> 放在表達式之前，表示以當前這個字符開始。(/^n/i,表示以n開頭)。
注意，我們經常管""叫"跳脫字符"。用于轉義一些特殊符號，如".","/"
界符：正則表達式的形式一般如下：
/love/
其中位于“/”定界符之間的部分就是將要在目標對象中進行匹配的模式。
元字符：就是指那些在正則表達式中具有特殊意義的專用字符，可以用來規定其前導字符（即位于元字符前面的字符）在目標對象中的出現模式。
較為常用的元字符包括： “+”， “*”，以及 “?”。
“+”元字符規定其前導字符必須在目標對象中連續出現一次或多次
“*”元字符規定其前導字符必須在目標對象中出現零次或連續多次，
“?”元字符規定其前導字符必須在目標對象中連續出現零次或一次。
下面，就讓我們來看一下正則表達式元字符的具體應用。
/fo+/
因為上述正則表達式中包含“+”元字符（它前面的“o”是前導字符），表示可以與目標對象中的“fool”, “fo”等在字母f后面連續出現一個或多個字母o的字符串相匹配。
除了元字符之外，用戶還可以精確指定模式在匹配對象中出現的頻率。例如，
/jim{2,6}/
上述正則表達式規定字符m可以在匹配對象中連續出現2-6次，因此，上述正則表達式可以同jimmy或jimmmmmy等字符串相匹配。
其它幾個重要的元字符的使用方式。
s：用于匹配單個空格符，包括tab鍵和換行符；
S：用于匹配除單個空格符之外的所有字符；
d：用于匹配從0到9的數字；
w：用于匹配字母，數字或下劃線字符；
W：用于匹配所有與w不匹配的字符；
. ：用于匹配除換行符之外的所有字符。
（說明：我們可以把s和S以及w和W看作互為逆運算）
下面，我們就通過實例看一下如何在正則表達式中使用上述元字符。
/s+/
上述正則表達式可以用于匹配目標對象中的一個或多個空格字符。
除了我們以上所介紹的元字符之外，正則表達式中還具有另外一種較為獨特的專用字符，即定位符。
定位符：用于規定匹配模式在目標對象中的出現位置。
較為常用的定位符包括： “^”, “$”, “b” 以及 “B”。
“^”定位符規定匹配模式必須出現在目標字符串的開頭
“$”定位符規定匹配模式必須出現在目標對象的結尾
b定位符規定匹配模式必須出現在目標字符串的開頭或結尾的兩個邊界之一
“B”定位符則規定匹配對象必須位于目標字符串的開頭和結尾兩個邊界之內，即匹配對象既不能作為目標字符串的開頭，也不能作為目標字符串的結尾。同樣，我們
也可以把“^”和“$”以及“b”和“B”看作是互為逆運算的兩組定位符。舉例來說：
/^hell/
因為上述正則表達式中包含“^”定位符，所以可以與目標對象中以 “hell”, “hello”或 “hellhound”開頭的字符串相匹配。
/ar$/
因為上述正則表達式中包含“$”定位符，所以可以與目標對象中以 “car”, “bar”或 “ar” 結尾的字符串相匹配。
/bbom/
因為上述正則表達式模式以“b”定位符開頭，所以可以與目標對象中以 “bomb”, 或 “bom”開頭的字符串相匹配。
/manb/
因為上述正則表達式模式以“b”定位符結尾，所以可以與目標對象中以 “human”, “woman”或 “man”結尾的字符串相匹配。
為了能夠方便用戶更加靈活的設定匹配模式，正則表達式允許使用者在匹配模式中指定某一個范圍而不局限于具體的字符。例如：
/[A-Z]/
上述正則表達式將會與從A到Z范圍內任何一個大寫字母相匹配。
/[a-z]/
上述正則表達式將會與從a到z范圍內任何一個小寫字母相匹配。
/[0-9]/
上述正則表達式將會與從0到9范圍內任何一個數字相匹配。
/([a-z][A-Z][0-9])+/
上述正則表達式將會與任何由字母和數字組成的字符串，如 “aB0” 等相匹配。這里需要提醒用戶注意的一點就是可以在正則表達式中使用 “()” 把字符串組合在一起。
“()”符號：包含的內容必須同時出現在目標對象中。因此，上述正則表達式將無法與諸如 “abc”等的字符串匹配，因為“abc”中的最后一個字符為字母而非數字。
如果我們希望在正則表達式中實現類似編程邏輯中的“或”運算，在多個不同的模式中任選一個進行匹配的話，可以使用管道符： “|”。例如：
/to|too|2/
上述正則表達式將會與目標對象中的 “to”, “too”, 或 “2” 相匹配。
否定符：“[^]”。與我們前文所介紹的定位符 “^” 不同，否定符 “[^]”規定目標對象中不能存在模式中所規定的字符串。例如：
/[^A-C]/
上述字符串將會與目標對象中除A，B，和C之外的任何字符相匹配。一般來說，當“^”出現在 “[]”內時就被視做否定運算符；而當“^”位于“[]”之外，或沒有“[]”時，則應當被視做定位符。
最后，當用戶需要在正則表達式的模式中加入元字符，并查找其匹配對象時，可以使用
轉義符：“”。例如：
/Th*/
上述正則表達式將會與目標對象中的“Th*”而非“The”等相匹配。
實際經驗介紹
還是得說說 ^ 和 $ 他們是分別用來匹配字符串的開始和結束，以下分別舉例說明：
“^The”：開頭一定要有”The”字符串；
“of despair$”：結尾一定要有”of despair” 的字符串；
那么，
“^abc$”：就是要求以abc開頭和以abc結尾的字符串，實際上是只有abc匹配；
“notice”：匹配包含notice的字符串；
你可以看見如果你沒有用我們提到的兩個字符（最后一個例子），就是說模式（正則表達式）可以出現在被檢驗字符串的任何地方，你沒有把他鎖定到兩邊。
接著，說說 ‘*' ‘+' 和 ‘?'
他們用來表示一個字符可以出現的次數或者順序，他們分別表示：
“zero or more”相當于{0,}
“one or more”相當于{1,}
“zero or one.”相當于{0,1}
這里是一些例子：
“ab*”：和ab{0,}同義，匹配以a開頭，后面可以接0個或者N個b組成的字符串(”a”, “ab”, “abbb”, 等)；
“ab+”：和ab{1,}同義，同上條一樣，但最少要有一個b存在 (”ab” “abbb”等)；
“ab?”：和ab{0,1}同義，可以沒有或者只有一個b；
“a?b+$”：匹配以一個或者0個a再加上一個以上的b結尾的字符串。
要點：'*' ‘+' 和 ‘?' 只管它前面那個字符。
你也可以在大括號里面限制字符出現的個數，比如：
“ab{2}”: 要求a后面一定要跟兩個b（一個也不能少）(”abb”)；
“ab{2,}”: 要求a后面一定要有兩個或者兩個以上b(如”abb” “abbbb” 等)；
“ab{3,5}”: 要求a后面可以有2－5個b(”abbb”, “abbbb”, or “abbbbb”)。
現在我們把一定幾個字符放到小括號里，比如：
“a(bc)*”: 匹配 a 后面跟0個或者一個”bc”；
“a(bc){1,5}”: 一個到5個 “bc”；
還有一個字符 ‘|'，相當于OR操作：
“hi|hello”: 匹配含有”hi” 或者 “hello” 的字符串；
“(b|cd)ef”: 匹配含有 “bef” 或者 “cdef”的字符串；
“(a|b)*c”: 匹配含有這樣多個（包括0個）a或b，后面跟一個c的字符串；
一個點('.')可以代表所有的單一字符，不包括” ”
如果，要匹配包括” ”在內的所有單個字符，怎么辦？
用'[ .]'這種模式。
“a.[0-9]”: 一個a加一個字符再加一個0到9的數字；
“^.{3}$”: 三個任意字符結尾。
中括號括住的內容只匹配一個單一的字符
“[ab]”: 匹配單個的 a 或者 b ( 和 “a│b” 一樣)；
“[a-d]”: 匹配'a' 到'd'的單個字符 (和”a│b│c│d” 還有 “[abcd]”效果一樣)；
一般我們都用[a-zA-Z]來指定字符為一個大小寫英文：
“^[a-zA-Z]”: 匹配以大小寫字母開頭的字符串；
“[0-9]%”: 匹配含有形如 x％的字符串；
“,[a-zA-Z0-9]$”: 匹配以逗號再加一個數字或字母結尾的字符串；
你也可以把你不想要得字符列在中括號里，你只需要在總括號里面使用'^' 作為開頭 “%[^a-zA-Z]%” 匹配含有兩個百分號里面有一個非字母的字符串。
要點：^用在中括號開頭的時候，就表示排除括號里的字符。
為了PHP能夠解釋，你必須在這些字符面前后加”，并且將一些字符轉義。
不要忘記在中括號里面的字符是這條規路的例外—在中括號里面，所有的特殊字符，包括(”)，都將失去他們的特殊性質 “[*+?{}.]”匹配含有這些字符的字符串：
還有，正如regx的手冊告訴我們：”如果列表里含有']'，最好把它作為列表里的第一個字符(可能跟在'^'后面)。如果含有'-'，最好把它放在最前面或者最后面
， or 或者一個范圍的第二個結束點[a-d-0-9]中間的‘-'將有效。
看了上面的例子，你對{n,m}應該理解了吧。要注意的是，n和m都不能為負整數，而且n總是小于m。這樣，才能最少匹配n次且最多匹配m次。如”p{1,5}”將匹配
“pvpppppp”中的前五個p
下面說說以開頭的
b 書上說他是用來匹配一個單詞邊界，就是…比如'veb'，可以匹配love里的ve而不匹配very里有ve
B 正好和上面的b相反。
正則表達式的其他用法
提取字符串
ereg() and eregi() 有一個特性是允許用戶通過正則表達式去提取字符串的一部分(具體用法你可以閱讀手冊)。比如說，我們想從 path/URL 提取文件名，下面的代
碼就是你需要：
ereg(”([^//]*)$”, $pathOrUrl, $regs);
echo $regs[1];
高級的代換
ereg_replace() 和 eregi_replace()也是非常有用的，假如我們想把所有的間隔負號都替換成逗號：
ereg_replace(”[ t]+”, “,”, trim($str));
以下為引用的內容：

復制代碼代碼如下:

		
		preg_match()和preg_match_all() 
		preg_quote() 
		preg_split() 
		preg_grep() 
		preg_replace() 

函數的具體使用，我們可以通過PHP手冊來找到，下面分享一些平時積累的正則表達式：
匹配action屬性

以下為引用的內容：

復制代碼代碼如下:

		
		$str = ''; 
		$match = ''; 
		preg_match_all('/s+action="(?!http:)(.*?)"s/', $str, $match); 
		print_r($match); 

在正則中使用回調函數

以下為引用的內容：

復制代碼代碼如下:

		
		/** 
		* replace some string by callback function 
		* 
		*/ 
		function callback_replace() { 
		$url = 'http://esfang.house.sina.com.cn'; 
		$str = ''; 
		$str = preg_replace ( '/(?<=saction=")(?!http:)(.*?)(?="s)/e', 'search($url, /1)', $str ); 
		echo $str; 
		} 
		function search($url, $match){ 
		return $url . '/' . $match; 
		} 

帶斷言的正則匹配

復制代碼代碼如下:

		
		代碼如下 復制代碼 
		$match = ''; 
		$str = 'xxxxxx.com.cn bold font 
		paragraph text 
		'; 
		preg_match_all ( '/(?<=<(w{1})>).*(?=</1>)/', $str, $match ); 
		echo "匹配沒有屬性的HTML標簽中的內容："; 
		print_r ( $match ); 

替換HTML源碼中的地址
以下為引用的內容：

復制代碼代碼如下:

		
		$form_html = preg_replace ( '/(?<=saction="|ssrc="|shref=")(?!http:|javascript)(.*?)(?="s)/e', 'add_url($url, '/1')', $form_html ); 

元字符
在上面的例子中，^ 、d 及 $ 等這些符號，代表了特定的匹配意義，我們稱之為元字符，常用的元字符如下：
元字符說明
. 匹配除換行符意外的任意字符
w 匹配字母或數字或下劃線
s 匹配任意的空白符
d 匹配數字
b 匹配單詞的開始或結束
^ 匹配字符串的開始
$ 匹配字符串的結束
[x] 匹配x字符，如匹配字符串中的 a、b 和 c 字符
W w的反義，即匹配任意非字母，數字，下劃線和漢字的字符
S s的反義，即匹配任意非空白符的字符
D d的反義，即匹配任意非數字的字符
B b的反義，即不是單詞開頭或結束的位置
[^x] 匹配除了 x 意外的任意字符，如 [^abc] 匹配除了 abc 這幾個字母之外的任意字符

上一篇：正則表達式在網頁處理中的應用四則

下一篇：javascript判斷中文的正則