什么是抽象語法樹?
抽象語法樹(abstract syntax tree,AST)是源代碼的抽象語法結(jié)構(gòu)的樹狀表示,樹上的每個(gè)節(jié)點(diǎn)都表示源代碼中的一種結(jié)構(gòu),這所以說是抽象的,是因?yàn)槌橄笳Z法樹并不會(huì)表示出真實(shí)語法出現(xiàn)的每一個(gè)細(xì)節(jié),比如說,嵌套括號(hào)被隱含在樹的結(jié)構(gòu)中,并沒有以節(jié)點(diǎn)的形式呈現(xiàn)。抽象語法樹并不依賴于源語言的語法,也就是說語法分析階段所采用的上下文無文法【文法是用于描述語言的語法結(jié)構(gòu)的形式規(guī)則。任何一種語言都有它自己的文法,不管它是機(jī)器語言還是自然語言。】,因?yàn)樵趯懳姆〞r(shí),經(jīng)常會(huì)對文法進(jìn)行等價(jià)的轉(zhuǎn)換(消除左遞歸,回溯,二義性等),這樣會(huì)給文法分析引入一些多余的成分,對后續(xù)階段造成不利影響,甚至?xí)购蟼€(gè)階段變得混亂。因些,很多編譯器經(jīng)常要獨(dú)立地構(gòu)造語法分析樹,為前端,后端建立一個(gè)清晰的接口
PHP-Parser的項(xiàng)目主頁是https://github.com/nikic/PHP-Parser。可以對多版本的PHP進(jìn)行完美解析,生成一顆抽象語法樹。
新的執(zhí)行過程
PHP7 的內(nèi)核中有一個(gè)重要的變化是加入了 AST。在 PHP5中,從 php 腳本到 opcodes 的執(zhí)行的過程是:
1.Lexing:詞法掃描分析,將源文件轉(zhuǎn)換成 token 流;
2.Parsing:語法分析,在此階段生成 op arrays。
PHP7 中在語法分析階段不再直接生成 op arrays,而是先生成 AST,所以過程多了一步:
1.Lexing:詞法掃描分析,將源文件轉(zhuǎn)換成 token 流;
2.Parsing:語法分析,從 token 流生成抽象語法樹;
3.Compilation:從抽象語法樹生成 op arrays。
執(zhí)行時(shí)間和內(nèi)存消耗
從以上的步驟來看,這比之前的過程還多了一步,所以按常理來說這反而會(huì)增加程序的執(zhí)行時(shí)間和內(nèi)存的使用。但事實(shí)上內(nèi)存的使用確實(shí)增加了,但是執(zhí)行時(shí)間上卻有所降低。
以下結(jié)果是使用小(代碼大約 100 行)、中(大約 700 行)、大(大約 2800 行)三個(gè)腳本分別進(jìn)行測試得到的,測試腳本: https://gist.github.com/nikic/289b0c7538b46c2220bc.
每個(gè)文件編譯 100 次的執(zhí)行時(shí)間(注意文章的測試結(jié)果時(shí)間是 14 年,PHP7 還叫 PHP-NG 的時(shí)候):
單次編譯中的內(nèi)存峰值:
單次編譯的測試結(jié)果可能并不能代表實(shí)際使用的情況,以下是使用 PhpParser 進(jìn)行完整項(xiàng)目測試得到的結(jié)果:
測試表明,使用 AST 之后程序的執(zhí)行時(shí)間整體上大概有 10% 到 15% 的提升,但是內(nèi)存消耗也有增加,在大文件單次編譯中增加明顯,但是在整個(gè)項(xiàng)目執(zhí)行過程中并不是很嚴(yán)重的問題。
還有注意的是以上的結(jié)果都是在沒有 Opcache 的情況下,生產(chǎn)環(huán)境中打開 Opcache 的情況下,內(nèi)存的消耗增加也不是很大的問題。
語義上的改變
如果僅僅是時(shí)間上的優(yōu)化,似乎也不是使用 AST 的充足理由。其實(shí)實(shí)現(xiàn) AST 并不是基于時(shí)間優(yōu)化上的考慮,而是為了解決語法上的問題。下面來看一下語義上的一些變化。
yield 不需要括號(hào)
在 PHP5 的實(shí)現(xiàn)中,如果在一個(gè)表達(dá)式上下文(例如在一個(gè)賦值表達(dá)式的右側(cè))中使用 yield,你必須在 yield 申明兩邊使用括號(hào):
?php$result = yield fn(); // 不合法的$result = (yield fn()); // 合法的
這種行為僅僅是因?yàn)?PHP5 的實(shí)現(xiàn)方式的限制,在 PHP7 中,括號(hào)不再是必須的了。所以下面這些寫法也都是合法的:
?php$result = yield;$result = yield $v;$result = yield $k =
當(dāng)然了,還得遵循 yield 的應(yīng)用場景才行。
括號(hào)不影響行為
在 PHP5 中,
?php($foo)[ bar ] = baz # PHP Parse error: Syntax error, unexpected [ on line 1
但是在 PHP7 中,兩種寫法表示同樣的意思。
同樣,如果函數(shù)的參數(shù)被括號(hào)包裹,類型檢查存在問題,在 PHP7 中這個(gè)問題也得到了解決:
?phpfunction func() { return [];function byRef(array $a) {byRef((func()));
以上代碼在 PHP5 中不會(huì)告警,除非使用 byRef(func()) 的方式調(diào)用,但是在 PHP7 中,不管 func() 兩邊有沒有括號(hào)都會(huì)產(chǎn)生以下錯(cuò)誤:
PHP Strict standards: Only variables should be passed by reference ...
list() 的變化
list 關(guān)鍵字的行為改變了很多。list 給變量賦值的順序(等號(hào)左右同時(shí)的順序)以前是從右至左,現(xiàn)在是從左到右:
?phplist($array[], $array[], $array[]) = [1, 2, 3];var_dump($array);// PHP5: $array = [3, 2, 1]// PHP7: $array = [1, 2, 3]# 注意這里的左右的順序指的是等號(hào)左右同時(shí)的順序,# list($a, $b) = [1, 2] 這種使用中 $a == 1, $b == 2 是沒有疑問的。
產(chǎn)生上面變化的原因正是因?yàn)樵?PHP5 的賦值過程中,3 會(huì)最先被填入數(shù)組,1 最后,但是現(xiàn)在順序改變了。
同樣的變化還有:
?php$a = [1, 2];list($a, $b) = $a;// PHP5: $a = 1, $b = 2// PHP7: $a = 1, $b = null + Undefined index 1
這是因?yàn)樵谝郧暗馁x值過程中 $b 先得到 2,然后 $a 的值才變成1,但是現(xiàn)在 $a 先變成了 1,不再是數(shù)組,所以 $b 就成了null。
list 現(xiàn)在只會(huì)訪問每個(gè)偏移量一次
?phplist(list($a, $b)) = $array;// PHP5:$b = $array[0][1];$a = $array[0][0];// PHP7:// 會(huì)產(chǎn)生一個(gè)中間變量,得到 $array[0] 的值$_tmp = $array[0];$a = $_tmp[0];$b = $_tmp[1];
空的 list 成員現(xiàn)在是全部禁止的,以前只是在某些情況下:
?phplist() = $a; // 不合法list($b, list()) = $a; // 不合法foreach ($a as list()) // 不合法 (PHP5 中也不合法)
引用賦值的順序
引用賦值的順序在 PHP5 中是從右到左的,現(xiàn)在時(shí)從左到右:
?php$obj = new stdClass;$obj- a = $obj- $obj- b = 1;var_dump($obj);// PHP5:object(stdClass)#1 (2) { [ b ] = int(1) [ a ] = int(1)// PHP7:object(stdClass)#1 (2) { [ a ] = int(1) [ b ] = int(1)}
__clone 方法可以直接調(diào)用
現(xiàn)在可以直接使用 $obj- __clone() 的寫法去調(diào)用 __clone 方法。 __clone 是之前唯一一個(gè)被禁止直接調(diào)用的魔術(shù)方法,之前你會(huì)得到一個(gè)這樣的錯(cuò)誤:
Fatal error:Cannot call __clone() method on objects -use clone $obj instead in...
變量語法一致性
AST 也解決了一些語法一致性的問題,這些問題是在另外一個(gè) RFC 中被提出的:https://wiki.php.net/rfc/uniform_variable_syntax.
在新的實(shí)現(xiàn)上,以前的一些語法表達(dá)的含義和現(xiàn)在有些不同,具體的可以參照下面的表格:
整體上還是以前的順序是從右到左,現(xiàn)在從左到右,同時(shí)也遵循括號(hào)不影響行為的原則。這些復(fù)雜的變量寫法是在實(shí)際開發(fā)中需要注意的。
相關(guān)推薦:《PHP教程》
以上就是PHP7 的抽象語法樹(AST)帶來的變化的詳細(xì)內(nèi)容,PHP教程
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。
新聞熱點(diǎn)
疑難解答
圖片精選