今天看了第5章幾個例子,有點收獲,記錄下來當作回顧也當作分享。
關于匹配字符串問題,有很多種類型,今天討論 js 代碼里的字符串匹配。(因為我想學完之后寫個語法高亮練手,所以用js代碼當作例子)
比如這樣一個字符串,匹配起來很簡單 /"[^"]*"/g 即可。
![]() |
PS: 白色截圖是 chrome 34 控制臺中運行的結果,深灰色是 sublime text 結果。
很容易就取到內容了,可是親,你有沒有想過,js字符串里允許轉義。
![]() |
這不是我們想要的結果,所以我們要處理下轉義問題。
轉義的規則是 / 后面跟著一個字符,所以我們用 //. 去匹配它,就有了這樣的正則 /"(?://.|[^"])*"/g
![]() | ||
|
消耗掉正確的轉義的意思是,比如 "aa//aa/"aa/ufffaa" 都會被正常匹配,因為這些都在正常的轉義。
形如 "aa//aa/"aa/ufff//"aa" 這里的 //" 其中 // 會被匹配,而 " 既不滿足 //. 也不滿足 [^"]
所以這個匹配結果會是 "aa//aa/"aa/ufff//" 后面的 aa" 無法匹配到。
所以現在我們得到了比較強力的正則,可以有效的匹配 js 代碼中的字符串了。
騷等,好像還有哪里不對。
js 字符串允許折行,形如這樣:
但是這樣的字符串用剛才的正則能匹配么?答案是能。
因為 / 不能被 //. 匹配,但是可以被 [^"] 匹配到,/ 后面一個字符是 /r, /n 或 /r/n (具體是什么換行符要看系統了) 都能被 [^"] 匹配到,所以我們無意間寫了個強力的表達式。
現在剩下最后一個問題了,就是 ' 的匹配。
我們修改下表達式 /"(?://.|[^"])*"|'(?://.|[^'])*'/g 就好了。
來測試一下:
匹配成功。
新聞熱點
疑難解答
圖片精選