2013-03-18 39 views
-2

我知道我不應該在HTML中使用正則表達式。 我想從一個HTML文件中提取圖像源,下面的例子:正則表達式 - 從HTML中提取img src

這可能是這樣的:

<img src = cid:header width="700" height="93" alt="Logo" /> 
<img src= cid:header width="700" height="93" alt="Logo" /> 
<img src =cid:header width="700" height="93" alt="Logo" /> 
<img src=cid:header width="700" height="93" alt="Logo" /> 

在每種情況下,I'ld喜歡拿「CID:標題」爲結果。

由於我的正則表達式知識基本上是零,所以我轉向你們。 我需要一個在「src」之後或「=」字符之後接受空格的模式。

SRC [mightBeSpace] = [mightBeSpace] CID:[mustNotBeSpace]

謝謝!

回答

2
^<img src\s?=\s?([^\s]+).*/>$ 
+1

我已經提供了這個,以匹配只包含您提供的內容的一行txt。請注意(正如@Kolink所指出的那樣)RegEx在匹配HTML – rbedger 2013-03-18 18:11:11

+0

src \ s?= \ s?([^ \ s] +)時很糟糕,這是我唯一需要的派對,謝謝! – 2013-03-18 18:18:17

+0

請標記爲答案,如果您認爲它足夠回答您的問題 – rbedger 2013-03-18 18:20:12

2

「可能是空間」中的正則表達式是\s*,以及「必須是沒有空間」轉換爲\S+

利用這些信息,你應該能夠建立一個正則表達式。如果你不能,請顯示你的嘗試。

+0

src \ s?= \ s?([^ \ s] +)解決了它,謝謝你的幫助! – 2013-03-18 18:18:58