2012-12-11 47 views
0

我有一個網址,我必須在url中找到聯繫鏈接。給定一個網址查找聯繫鏈接

所以我做的是使用simple_html_dom.php來遍歷所有的標籤,如果它包含單詞「聯繫」或「廣告」,那麼它是聯繫人的網址。但這實際上非常緩慢。

因此,我現在要做的就是使用捲曲(沒問題,甚至在將來會多捲曲)刮掉頁面,並且如果鏈接包含「聯繫人」,則正則表達式嘗試在刮取結果中查找aa href鏈接。或「廣告」。

我會使用preg_match_all但正則表達式是什麼?

+0

如何利用谷歌做搜索\爲您抓取? – 2012-12-11 22:31:49

+0

Dom,xpath,'// a [包含(@ href,'contact')]'...完成。 '簡單的dom'適用於那些擁有巨大的備用cpu週期的人......慢,慢,慢。 – Wrikken

+0

什麼是'simple_html_dom.php'?需要參考 – Alexander

回答

1
preg_match_all('/\<a href\=\"(.*?(contact|advertis)+.*?)\"\>(.+?)\<\/a>/m', $page, $matches); 
+0

謝謝,這個工程。我將使用這個或DOM模塊。謝謝! – gprime

+0

樂於幫助! –