a亚洲精品_精品国产91乱码一区二区三区_亚洲精品在线免费观看视频_欧美日韩亚洲国产综合_久久久久久久久久久成人_在线区

首頁 > 編程 > Regex > 正文

還不會(huì)正則表達(dá)式?趕快看這篇!

2020-03-16 20:43:12
字體:
供稿:網(wǎng)友

正則表達(dá)式是很多程序員,甚至是一些有了多年經(jīng)驗(yàn)的開發(fā)者薄弱的一項(xiàng)技能。大家都很多時(shí)候都會(huì)覺得正則表達(dá)式難記、難學(xué)、難用,但不可否認(rèn)的是正則表達(dá)式是一項(xiàng)很重要的技能,所有我將學(xué)習(xí)和使用正則表達(dá)式時(shí)的關(guān)鍵點(diǎn)整理如下,供大家參考。

不同語言中的正則表達(dá)式寫法有少許差異,本文將使用 Javascript 中的語法。

什么是正則表達(dá)式?

正則表達(dá)式(Regular Expression 或 Regex),是用于定義某種特定搜索模式的字符組合。正則表達(dá)式可用于匹配、查找和替換文本中的字符,進(jìn)行輸入數(shù)據(jù)的驗(yàn)證,查找英文單詞的拼寫錯(cuò)誤等。

調(diào)試工具

下面列出了幾款優(yōu)秀的在線調(diào)試工具,如果你想創(chuàng)建或者調(diào)試正則表達(dá)式可能會(huì)需要。個(gè)人比較偏好Regex101,regex101 支持在正則表達(dá)式的不同 flavor 之間切換、解釋你的正則表達(dá)式、顯示匹配信息、提供常用語法參考等功能,非常強(qiáng)大。

Regex101

正則表達(dá)式

Regexr

正則表達(dá)式

Regexpal

正則表達(dá)式

開始

在 Javascript 中,一個(gè)正則表達(dá)式以 / 開頭和結(jié)尾,所以簡單至 /hello regexp/ 就是一個(gè)正則表達(dá)式。

Flags(標(biāo)志符或修飾符)

Flags 寫在結(jié)束的/之后,可以影響整個(gè)正則表達(dá)式的匹配行為。常見的 flags 有:

g:全局匹配(global);正則表達(dá)式默認(rèn)只會(huì)返回第一個(gè)匹配結(jié)果,使用標(biāo)志符g則可以返回所有匹配i:忽略大小寫(case-insensitive);在匹配時(shí)忽略英文字母的大小寫m:多行匹配(multiline);將開始和結(jié)束字符(^和$)視為在多行上工作,即分別匹配每一行(由 /n 或 /r 分割)的開始和結(jié)束,而不只是只匹配整個(gè)輸入字符串的最開始和最末尾處

Flags 可以組合使用,如:

正則表達(dá)式

Character Sets(字符集合)

用于匹配字符集合中的任意一個(gè)字符,常見的字符集有:

[xyz]:匹配 "x""y"``"z"[^xyz]:補(bǔ)集,匹配除 "x" "y" "z"的其他字符[a-z]:匹配從 "a" 到 "z"的任意字符[^a-n]:補(bǔ)集,匹配除 "a" 到 "n" 的其他字符[A-Z]:匹配從 "A" 到 "Z" 的任意字符[0-9]:匹配從 "0" 到 "9" 的任意數(shù)字

比如匹配所有的字母和數(shù)字可以寫成:/[a-zA-Z0-9]/ 或者 /[a-z0-9]/i

Quantifiers (量詞)

在實(shí)際使用中,我們常常需要匹配同一類型的字符多次,比如匹配 11 位的手機(jī)號(hào),我們不可能將 [0-9] 寫 11 遍,此時(shí)我們可以使用 Quantifiers 來實(shí)現(xiàn)重復(fù)匹配。

{n}:匹配 n 次{n,m}:匹配 n-m 次{n,}:匹配 >=n 次?:匹配 0 || 1 次*:匹配 >=0 次,等價(jià)于 {0,}+:匹配 >=1 次,等價(jià)于 {1,}

Metacharacters(元字符)

在正則表達(dá)式中有一些具有特殊含義的字母,被稱為元字符,簡言之,元字符就是描述字符的字符,它用于對字符表達(dá)式的內(nèi)容、轉(zhuǎn)換及各種操作信息進(jìn)行描述。

常見的元字符有:

/d:匹配任意數(shù)字,等價(jià)于 [0-9]/D:匹配任意非數(shù)字字符;/d 的補(bǔ)集/w:匹配任意基本拉丁字母表中的字母和數(shù)字,以及下劃線;等價(jià)于 [A-Za-z0-9_]/W:匹配任意非基本拉丁字母表中的字母和數(shù)字,以及下劃線;/w 的補(bǔ)集/s:匹配一個(gè)空白符,包括空格、制表符、換頁符、換行符和其他 Unicode 空格/S:匹配一個(gè)非空白符;/s的補(bǔ)集/b:匹配一個(gè)零寬單詞邊界,如一個(gè)字母與一個(gè)空格之間;例如,//bno/ 匹配 "at noon" 中的 "no"/ly/b/ 匹配 "possibly yesterday." 中的 "ly"/B:匹配一個(gè)零寬非單詞邊界,如兩個(gè)字母之間或兩個(gè)空格之間;例如,//Bon/ 匹配 "at noon" 中的 "on"/ye/B/ 匹配 "possibly yesterday." 中的 "ye"/t:匹配一個(gè)水平制表符(tab)/n:匹配一個(gè)換行符(newline)/r:匹配一個(gè)回車符(carriage return)

Special Characters (特殊字符)

正則中存在一些特殊字符,它們不會(huì)按照字面意思進(jìn)行匹配,而有特殊的意義,比如前文講過用于量詞的?*+。其他常見的特殊字符有:

/:轉(zhuǎn)義字符,可以將普通字符轉(zhuǎn)成特殊字符。比如 /w;也可以將特殊字符轉(zhuǎn)成字面意思,比如 /+ 匹配 "+".:匹配任意單個(gè)字符,但是換行符除外:/n/r/u2028 或 /u2029;在字符集中([.]),無特殊含義,即表示 '.' 的字面意思|:替換字符(alternate character),匹配 | 前或后的表達(dá)式。比如需要同時(shí)匹配 "bear" 和 "pear",可以使用 /(b|p)ear/ 或者 /bear|pear/;但是不能用 /b|pear/,該表達(dá)式只能匹配 "b" 和 "pear"^:匹配輸入的開始。比如,/^A/ 不匹配 "an Apple" 中的 "A",但匹配 "An apple" 中的 "A"$:匹配輸入的結(jié)尾。比如,/t$/ 不匹配 "eater" 中的 "t",但匹配 "eat" 中的 "t"^ 和 $ 在表單驗(yàn)證時(shí)常需要使用,因?yàn)樾枰?yàn)證從開始到結(jié)尾的一個(gè)完整輸入,而不是匹配輸入中的某一段

Groups(分組)(xyz):捕獲分組(Capturing Group),匹配并捕獲匹配項(xiàng);例如,/(foo)/ 匹配且捕獲 "foo bar." 中的 "foo"。被匹配的子字符串可以在結(jié)果數(shù)組的元素 [1], ..., [n] 中找到,或在被定義的 RegExp 對象的屬性 $1, ..., $9 中找到(?:xyz):非捕獲分組(Non-capturing Group),匹配但不會(huì)捕獲匹配項(xiàng);匹配項(xiàng)不能再次被訪問到/nn 是一個(gè)正整數(shù),表示反向引用(back reference),指向正則表達(dá)式中第 n 個(gè)括號(hào)(從左開始數(shù))中匹配的子字符串;例如,/apple(,)/sorange/1/ 匹配 "apple, orange, cherry, peach." 中的 "apple,orange,"

Assertion(斷言)x(?=y):僅匹配被y跟隨的x;例如,/bruce(?=wayne)/,如果"bruce"后面跟著wayne,則匹配之。/bruce(?=wayne|banner)/ ,如果"bruce"后面跟著"wayne"或者banner,則匹配之。但是,"wayne" 和 "banner" 都不會(huì)在匹配結(jié)果中出現(xiàn)x(?!y):僅匹配不被y跟隨的x;例如,//d+(?!/.)/ 只會(huì)匹配不被 "." 跟隨的數(shù)字。

//d+(?!/.)/.exec('3.141')` 匹配 `"141"`,而不是 `"3.141"

最后,推薦大家使用Fundebug,一款很好用的 BUG 監(jiān)控工具~

應(yīng)用

上面羅列出了這么多正則表達(dá)式的語法和規(guī)則,可以在一定程度上幫助我們分析和理解一段正則表達(dá)式的作用,但是如何將這些規(guī)則組合并創(chuàng)造出有特定作用的表達(dá)式還需要我們自己多加練習(xí),下面舉幾個(gè)例子來說明運(yùn)用這些規(guī)則。

1. 匹配手機(jī)號(hào)碼

我們先從比較簡單的匹配手機(jī)號(hào)碼開始。目前國內(nèi)的手機(jī)號(hào)碼是1(3/4/5/7/8)開頭的 11 位數(shù)字,因此手機(jī)號(hào)碼的正則可以分解為以下幾部分:

以 1 開頭:/^1/第 2 位為3、4、5、7、8中的一個(gè):/[34578]/ 或 /(3|4|5|7|8)/剩余 3-11 位均為數(shù)字,并以數(shù)字結(jié)尾://d{9}$/

組合起來即為 /^1[34578]/d{9}$/ 或 /^1(3|4|5|7|8)/d{9}$/,因?yàn)槭褂貌东@括號(hào)存在性能損失,所以推薦使用第一種寫法。

2. 匹配電子郵件

標(biāo)準(zhǔn)的電子郵件組成為 <yourname>@<domain>.<extension><optional-extension>

每部分的格式標(biāo)準(zhǔn)為(進(jìn)行了相應(yīng)的簡化,主要為展示如何書寫正則):

yourname:任意英文字母(a-z/A-Z)、數(shù)字(0-9)、下劃線(_)、英文句點(diǎn)(.)、連字符(-),長度大于 0domain:任意英文字母(a-z/A-Z)、數(shù)字(0-9)、連字符(-),長度大于 0extension:任意英文字母(a-z/A-Z),長度 2-8optional-extension:"."開頭,后面跟任意英文字母(a-z/A-Z),長度 2-8,可選

每部分的正則表達(dá)式為:

yourname:/[a-z/d._-]+/domain:/[a-z/d-]+/extension: /[a-z]{2,8}/optional-extension:/(/.[a-z]{2,8})?/

組合起來形成最后的正則表達(dá)式:/^([a-z/d._-]+)@([a-z/d-]+)/.([a-z]{2,8})(/.[a-z]{2,8})?$/;為了增加可讀性可以將每部分用"()"包起來,并不要忘記起始和結(jié)束符 ^$

結(jié)語

今天關(guān)于正則表達(dá)式的普及就先到這兒,希望對大家以后寫正則能有一點(diǎn)幫助。關(guān)于本文中沒有涉及到的知識(shí)可以參考以下鏈接:

Wikipedia - Regular ExpressionMDN - Regular ExpressionMicrosoft - Regular Expression ReferenceW3schools - Regexp

好了,本文就給大家介紹到這里,希望對大家有所幫助!


注:相關(guān)教程知識(shí)閱讀請移步到正則表達(dá)式頻道。
發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 久久噜噜噜精品国产亚洲综合 | 国产在线精品一区二区 | 毛片搜索| 亚洲国产日韩a在线播放性色 | 亚洲午夜精品久久久久久app | 天天天干干干 | 国产99久久久国产精品 | 欧美在线网站 | 精品福利一区二区三区 | 成人午夜影院 | 十八岁禁看网站 | 精品在线一区二区 | 黄色片com | 国产一区免费 | 日韩av一区二区三区在线观看 | 亚洲a网 | 亚洲综合在线一区二区 | 亚洲日韩欧美一区二区在线 | 中文字幕第二十六页页 | 欧美综合一区二区三区 | 国产精品地址 | 女女百合高h喷汁呻吟视频 女女野外嗯啊高潮h百合扶她 | 日韩视频免费看 | 国产精品久久免费视频在线 | 亚洲视频在线观看 | 夜夜操天天干 | 国产福利精品一区二区三区 | 亚洲乱码一区二区三区在线观看 | 日韩欧美国产精品一区二区三区 | 91精品国产高清一区二区三区 | 黄色免费网| 欧日韩在线观看视频 | 久久精品国产一区二区三区不卡 | 欧美国产精品一区 | 91偷拍精品一区二区三区 | 成人在线免费观看 | 黄色一级免费看 | 中文字幕在线观看网站 | 欧美日韩免费一区二区三区 | 欧美日本国产欧美日本韩国99 | 美女131mm久久爽爽免费 |