2011-12-12 15 views
0

我試圖使用正則表達式來解析出 標籤。我得到的正則表達式幾乎和我需要的一樣,只有一個小問題。問題是,正則表達式不包括它找到的匹配的第一個字母。我會告訴你我是什麼意思?首先,這裏是我現在使用正則表達式:使用正則表達式在結果中包含匹配的A-Z

(?<=h1.*\>[a-zA-Z0-9])(.*?)(?=\<\/) 

而且可以說的HTML代碼,我一直在尋找解析 標記出來的樣子此:

<h1 align="center"><strong><font color="#FF0000">I'm an H1 Tag!!</font></strong></h1> 

正則表達式我使用的匹配這一點的上述HTML代碼:

「M H1標籤!!因此,正如你所看到的那樣,它將放棄比賽的第一部分(「我」中的「我」)。

所以我的問題是,我如何使用到目前爲止的正則表達式匹配我設置的方式,但要包含它找到的第一個字母或數字(如果它找到一個)?

回答

0

我想你應該包括在支架

(?<=h1.*\>([a-zA-Z0-9]).*?)(?=\<\/) 
+0

你接近一月Turon的第一個字母,但你給我的想法得到正確的答案我自己的問題,這樣的感謝。無論如何,這是它的工作原理: (?<=h1.*\>)[a-zA-Z0-9](。*?)(?= \ <\ /) 我會「回答我自己的問題」我沒有足夠的「聲譽」去做,所以我只能在評論中提出答案。 – Learning

相關問題