a亚洲精品_精品国产91乱码一区二区三区_亚洲精品在线免费观看视频_欧美日韩亚洲国产综合_久久久久久久久久久成人_在线区

首頁 > 編程 > Regex > 正文

PHP中的遞歸正則的使用說明

2024-09-07 17:40:04
字體:
來源:轉載
供稿:網友

工作中最常用的是正則表達式,但85%以上的問題都可以使用基本語法來解決,合理有效地使用正則表達式來解決復雜問題也是一種技能和知識,本文主要介紹PHP中的遞歸正則的使用說明,一起來看看吧!

之前一篇文章翻譯了Perl語言中的遞歸正則表達式. 其實不少語言中的正則都是支持遞歸的, 例如本文要介紹的PHP正則遞歸. 雖然, 工作中最常用的正則表達式都很”正則”, 只用最基本的語法就能解決85%以上的問題, 而且合理有效地使用普通正則來解決復雜問題也是一門技巧與學問; 但是高級一點的語法的確有它存的價值, 有時不用它還真辦不了事兒; 況且學習正則的樂趣也在于嘗試各種各樣的可能性, 滿足自己無窮無盡的好奇心.

正文
例子
什么時候會用到遞歸正則表達式呢? 當然是待匹配的字串中遞歸地出現某種模式時(貌似廢話). 最經典的例子, 就是遞歸正則處理嵌套括號的問題了. 例子如下.

假設你的文本中包含了正確配對的嵌套括號. 括號的深度可以是無限層. 你想捕獲這樣的括號組.

恕我劇透, 標準答案是這樣的:
?

?

<?php
$string = "some text (a(b(c)d)e) more text";
if(preg_match("http://(([^()]+|(?R))*/)/",$string,$matches))
{
echo "<pre>"; print_r($matches); echo "</pre>";
}
?>


其輸出結果是:

?

?

?

?

?


Array
(
[0] => (a(b(c)d)e)
[1] => e
)


可見, 我們所需要的文本, 已經捕獲到$matches[0]中了.

原理
現在思考原理.

上面的正則表達式中的關鍵點是(?R). (?R)的作用就是遞歸地替換它所在的整條正則表達式. 在每次迭代時, PHP 語法分析器都會將(?R)替換為”/(([^()]+|(?R))*/)“.

因此, 具體到上述的例子, 其正則表達式等價于:

"http://(([^()]+|/(([^()]+|/(([^()]+)*/))*/))*/)/"

但是上面的代碼只適合深度為3層的括號. 對于未知深度的括號嵌套, 就只好使用這種正則了:

"http://(([^()]+|(?R))*/)/"

它不但能夠匹配無限深度, 還簡化了正則表達式的語法. 功能強大, 語法簡潔.

現在來細看一下"http://(([^()]+|(?R))*/)/"是怎樣匹配"(a(b(c)d)e)"的:

"(c)"這部分被正則式 "/(([^()]+)*/)" 匹配. 請注意, (c) 其實就相當于整個遞歸的一個縮影, 麻雀雖小五臟俱全, 因此它用到了整個正則表達式.
換言之, 下一步中的(c), 可以使用(?R) 來匹配.
(b(c)d)的匹配過程為:
"/("匹配"(";
"[^()]+"匹配"b";
(?R)匹配"(c)";
"[^()]+"匹配"d";
"/)"匹配")".
根據上面的匹配原理, 不難理解為什么數組的第2個元素$matches[1]與'e'等價. 子串'e'是在最后一次匹配迭代中被捕獲. 匹配過程中, 只有最后一次的捕獲結果才會保存到數組中.

rex注: 關于這個特性, 可以自行嘗試一下, 看看使用正則式([a-z]+[0-9]+)+來匹配字串abc123xyz890, 其捕獲結果$1是什么. 注意, 其結果與 Left Longest 原理并不沖突.

如果我們只需要捕獲 $matches[0], 可以這樣做:

?

?

?

?

?


<?php
$string = "some text (a(b(c)d)e) more text";
if(preg_match("http://((?:[^()]+|(?R))*/)/",$string,$matches))
{
echo "<pre>"; print_r($matches); echo "</pre>";
}
?>


產生的結果相同:

?

?

?


Array
(
[0] => (a(b(c)d)e)
)


所做的改動是捕獲括號()改為非捕獲捕獲括號(?:)了.

還可以進一步完善為:

?

?

?

?

?


<?php
$string = "some text (a(b(c)d)e) more text";
if(preg_match("http://((?>[^()]+|(?R))*/)/",$string,$matches))
{
echo "<pre>"; print_r($matches); echo "</pre>";
}
?>


這里我們用到了所謂的一次性模式(rex注: 余晟先生譯的《精通正則表達式v3.0》中, 謂之”固化分組”. 可參考該書.) PHP手冊也推薦只要條件允許, 就盡可能使用這種模式, 以便提升正則表達式的速度.

一次性模式很簡單, 這里不再詳述. 如果感興趣, 可以參考PHP 官方手冊. 如果您想深入學習PERL兼容式正則表達式, 請參考文末鏈接.

上文是PHP中的遞歸正則的使用說明已經介紹給大家了,大家讀完后,都掌握了嗎?希望您能繼續支持錯新技術頻道!

?

?

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 欧美成人a交片免费看 | 久久青青操 | 91久久精品www人人做人人爽 | 欧美影院一区 | 麻豆精品国产传媒 | 91亚洲精品久久久 | 色噜噜狠狠狠综合曰曰曰 | 成人在线看片 | 嫩呦国产一区二区三区av | 秋霞久久久 | 欧美日韩中文字幕 | 午夜精品久久久久久 | 丝袜+亚洲+另类+欧美+变态 | 日韩一区欧美 | 一区二区三区高清 | 中文二区| 日韩 国产 在线 | 国产精品久久久久影院色老大 | 成人在线视频网 | 中文字幕在线官网 | 不卡在线 | 久久久免费电影 | 国产在线不卡 | 日本高清视频网站www | 亚洲一区二区精品视频 | 日韩不卡在线 | 欧美精品在线看 | 欧美国产日韩在线观看 | 99精品欧美一区二区三区 | www一区| 黄色片一区 | 91伦理片| 成人毛片视频网站 | 亚洲一区久久久 | 操操网 | 国内精品一区二区 | 狠狠操操操 | 久久久久久久久久久久影院 | 天天躁日日躁狠狠躁av麻豆 | 久久久亚洲一区 | 亚洲一区二区三区视频 |