2012-05-17 74 views
0

我想從HTML代碼中獲取所有的網站。問題是我有一個正則表達式,其中包含所有的URL,但地址中需要有www。我需要使用哪種正則表達式來獲取內容中沒有www的網址?正則表達式匹配的網站只有http沒有www

更新:我使用的正則表達式是:

string anchorPattern = 
    @"(?<Protocol>\w+)://(?<Domain>[\[email protected]][\w.:@]+)/?[\w.?=%&=\[email protected]/$,&amp;+]*'"; 
+0

強制鏈接:http://stackoverflow.com/a/1732454/960195 –

+0

強制性的問題:你現在有什麼正則表達式? –

+1

@AdamMihalcin:只要他只是想提取網址,使用正則表達式就非常好。這是一個HTML文檔,這並不重要,因爲他沒有在裏面尋找URL。 href屬性。 – ThiefMaster

回答

0

一個像你這樣,但沒有看起來像www\.