a亚洲精品_精品国产91乱码一区二区三区_亚洲精品在线免费观看视频_欧美日韩亚洲国产综合_久久久久久久久久久成人_在线区

首頁 > 編程 > Regex > 正文

正則表達式教程之位置匹配詳解

2020-03-16 20:55:27
字體:
供稿:網(wǎng)友

本文實例講述了正則表達式教程之位置匹配。分享給大家供大家參考,具體如下:

注:在所有例子中正則表達式匹配結(jié)果包含在源文本中的之間,有的例子會使用Java來實現(xiàn),如果是java本身正則表達式的用法,會在相應(yīng)的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

一、問題引入

如果想匹配一段文本中的某個單詞(暫不考慮多行模式,將在后面介紹),我們可能會像下面這樣:

文本:Yesterday is history, tomorrow is a mystery, but today is a gift.

正則表達式:is

結(jié)果:Yesterday 【is】 h【is】tory, tomorrow 【is】 a mystery, but today 【is】 a gift.

分析:本來只是要匹配單詞is,但把其他單詞中包含的is也匹配出來了。要解決這個問題,使用邊界界定符,也就是在正則表達式里用一些元字符來表明我們想讓匹配操作在什么位置(或邊界)發(fā)生。

二、單詞邊界

一種常用的邊界是由限定符/b指定的單詞邊界,/b用來匹配單詞的開始和結(jié)尾。更確切地說,它是匹配這樣一個位置,這個位置位于一個能夠用來構(gòu)成單詞的字符(字母、數(shù)字、下劃線,也就是與/w相匹配的字符)和一個不能用來構(gòu)成單詞的字符(與/W相匹配的字符)之間。來看前面的例子:

文本:Yesterday is history, tomorrow is a mystery, but today is a gift.

正則表達式:/bis/b

結(jié)果:Yesterday 【is】 history, tomorrow 【is】 a mystery, but today 【is】 a gift.

分析:在原始文本中,單詞is的前后都有一個空格,而這與模式/bis/b匹配(空格是用來分隔單詞的字符之一)。而單詞history中也包含了is,因為它的前后分別有一個字符h和t,這兩個字符都不能與/b匹配。

如果不匹配一個單詞邊界,則使用/B。如:

文本:Please enter the nine-digit id as it appears on your color - coded pass-key.

正則表達式:/B-/B

結(jié)果:Please enter the 【nine-digit】 id as it appears on your color - coded 【pass-key】.

分析:/B-/B將匹配一個前后都不是單詞邊界的連字符,nine-digit和pass-key中連字符前后都沒有空格,所以能夠匹配,而color - coded中連字符前后都有空格,所以不能匹配。

三、字符串邊界

單詞邊界可以用來進行與單詞有關(guān)的位置匹配(單詞開頭、結(jié)束、整個單詞等等)。而字符串邊界也有著類似的用途,只不過是用來進行與字符串有關(guān)的位置匹配(字符串開頭、結(jié)束、整個字符串等等)。用來定義字符串邊界的元字符有兩個:一個是用來定義字符串開頭的^,另一個是用來定義字符串結(jié)尾的$。

比如要檢查一個XML文檔的合法性,合法的XML文檔都以<?xml…..?>這樣形式開頭:

文本:

<?xml version="1.0" encoding="UTF-8"?><project basedir="." default="ear"></project>

正則表達式:^/s*</?xml.*?/?>

結(jié)果:

<?xml version="1.0" encoding="UTF-8"?>
<project basedir="." default="ear">
</project>

分析:^匹配一個字符串的開頭位置,所以^/s*將匹配一個字符串的開頭位置和隨后的零個或多個空白字符,因為<?xml>標(biāo)簽前面允許有空格、制表符、換行符等空白字符。

$元字符符的用法除了位置上的差異外,與^用法完全一樣。比如,檢查一個html頁面是否以</html>結(jié)尾,可以用模式:</[Hh][Tt][Mm][Ll]>/s*$

四、多行匹配模式

正則表達式可以通過一些特殊的元字符來改變另外一些元字符的行為。可以通過(?m) 來啟用多行匹配模式。多行匹配模式將使得正則表達式引擎把行分隔符當(dāng)做一個字符串分隔符來對待。在多行匹配模式下,^不僅匹配正常的字符串開頭,還將匹配行分隔符(換行符)后面的開始位置,$不僅匹配正常的字符串結(jié)尾,還將匹配行分隔符(換行符)后面的結(jié)束位置。

在使用時,(?m)必須出現(xiàn)在整個模式的最前面。比如,通過正則表達式把一段java代碼中的單行注釋(以//開始)內(nèi)容全部找出來。

文本:

publicDownloadingDialog(Frame parent){     //Callsuper constructor, specifying that dialog box is modal.     super(parent,true);     //Setdialog box title.     setTitle("E-mailClient");     //Instructwindow not to close when the "X" is clicked.     setDefaultCloseOperation(DO_NOTHING_ON_CLOSE);     //Puta message with a nice border in this dialog box.     JPanelcontentPanel = new JPanel();     contentPanel.setBorder(BorderFactory.createEmptyBorder(5,5, 5, 5));     contentPanel.add(newJLabel("Downloading messages..."));     setContentPane(contentPanel);     //Sizedialog box to components.     pack();     //Centerdialog box over application.     setLocationRelativeTo(parent);}

正則表達式:(?m)^/s*//.*$

結(jié)果:

         publicDownloadingDialog(Frame parent){
【              //Call superconstructor, specifying that dialog box is modal.】
                   super(parent,true);
【              //Set dialog boxtitle.】
                   setTitle("E-mailClient");
【              //Instruct windownot to close when the "X" is clicked.】
                   setDefaultCloseOperation(DO_NOTHING_ON_CLOSE);
【              //Put a messagewith a nice border in this dialog box.】
                   JPanelcontentPanel = new JPanel();
                   contentPanel.setBorder(BorderFactory.createEmptyBorder(5,5, 5, 5));
                   contentPanel.add(newJLabel("Downloading messages..."));
                   setContentPane(contentPanel);
【              //Size dialog boxto components.】
                   pack();
【              //Center dialogbox over application.】
                   setLocationRelativeTo(parent);
         }

分析:^/s*//.*$將匹配一個字符串的開始,然后是任意多個空白字符,再后面是//,再往后是任意文本,最后是一個字符串的結(jié)束。不過這個模式只能找出第一條注釋,加上(?m)前綴后,將把換行符視為一個字符串分隔符,這樣就可以把每一行注釋匹配出來了。

java代碼實現(xiàn)如下(文本保存在text.txt文件中):

public static String getTextFromFile(String path) throws Exception{  BufferedReader br = new BufferedReader(new FileReader(new File(path)));  StringBuilder sb = new StringBuilder();  char[] cbuf = new char[1024];  int len = 0;  while(br.ready() && (len = br.read(cbuf)) > 0){    br.read(cbuf);    sb.append(cbuf, 0, len);  }    br.close();  return sb.toString();}public static void multilineMatch() throws Exception{  String text = getTextFromFile("E:/text.txt");  String regex = "(?m)^//s*//.*$";  Matcher m = Pattern.compile(regex).matcher(text);  while(m.find()){    System.out.println(m.group());  }}

輸出結(jié)果如下:

//Call super constructor, specifying that dialog box is modal.
//Set dialog box title.
//Instruct window not to close when the "X" is clicked.
//Put a message with a nice border in this dialog box.
//Size dialog box to components.
//Center dialog box over application.

五、小結(jié)

正則表達式不僅可以用來匹配任意長度的文本塊,還可以用來匹配出現(xiàn)在字符串中特定位置的文本。/b用來指定一個單詞邊界(/B剛好相反)。^和$用來指定單詞邊界。如果與(?m)配合使用,^和$還將匹配在一個換行符處開頭或結(jié)尾的字符串。在接下來的文章中將介紹子表達式的使用。

希望本文所述對大家正則表達式學(xué)習(xí)有所幫助。


注:相關(guān)教程知識閱讀請移步到正則表達式頻道。
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 日韩激情免费 | 久久成人免费视频 | 国产精品㊣新片速递bt | 99av| 欧美精品久久久久 | 国产精品永久免费视频 | 国产精品天天干 | 成人精品一区二区三区中文字幕 | 国产精品久久九九 | 日一区二区| 久久99精品国产91久久来源 | 午夜免 | 99免费观看视频 | 天天射影院 | 日韩欧美在线综合 | julia中文字幕久久一区二区 | 中文字幕 国产 | 国产91久久精品 | 婷婷激情综合 | 香蕉国产精品 | 999在线观看精品免费不卡网站 | 精品一区亚洲 | 一区免费视频 | 一级女性全黄久久生活片免费 | 国产精品久久久久久久久久久免费看 | 成人黄色在线 | 日韩不卡一区二区三区 | 日本一区二区高清不卡 | k8久久久一区二区三区 | 国产不卡二区 | 亚洲欧美中文日韩v在线观看 | 99精品全国免费观看视频软件 | 免费看片国产 | 91麻豆精品国产91久久久久久久久 | 青青草久草 | 国产精品一区二区在线 | 一本色道久久加勒比88综合 | 国产成人一区 | 国产精品久久久久久久久久久免费看 | 91人人澡人人爽 | 一区二区三区高清 |