2011-11-11 37 views
-2

我想要做的是我想抓取一個網站的例子www.abc.com所有頁面,看看是否有任何其他域代碼在所有頁面的實例。例如,如果該網站對www.xyz.com有一些引用,那麼它應該顯示該頁面正在引用一些其他的URL /域。在線工具或編程方式確定網頁鏈接到其他網站

想用PHP,我已經做了研究,但所有我能找到的是你用什麼語言殘破的鏈接檢查

回答

1

?你有什麼嘗試?

這可以歸結爲兩個步驟:

  1. 抓取網頁。許多現代語言包括庫在許多語言,包括PHP爲此,在.NET WebRequesturllib在python,cURL
  2. 搜索通過頁面的文本,搜索匹配URL的模式的字符串。正則表達式在這裏規則在PHP中,您可以使用preg_match()
+0

謝謝我將使用PHP – user580950