2012-11-24 45 views
0

我想要做的是使用PHP來抓取我輸入參數的網址。基於PHP的網頁刮板

我想整個原始源代碼。但是那不是全部..

我想它,然後保存爲一個HTML頁面,併到PHP腳本的本地服務器。

這是否有一個簡單的代碼段?或者有人可以輕鬆地給我寫一個代碼?

例如

我想刮http://google.com

因此,舉例來說,mysite.com/scrape.php?url=http://google.com

我希望它保存谷歌的頭版爲http://mysite.com/scraped/google.com.html

+0

通過'刮'你的意思是'下載'? – MiJyn

+0

如何查看'file_get_contents()'和'file_put_contents()'的文檔' – Cyclonecode

回答

2

這裏有一個腳本,將指定URL的內容保存到一個名爲scraped.html文件:

if (isset($_GET['url'])): 
    $contents = file_get_contents($_GET['url']); 
    file_put_contents('scraped.html', $contents); 
endif; 

要在撥打file_get_contents()時使用網址,您必須在您的php.ini文件中啓用allow_url_fopen

當然,這隻會保存請求的url的實際來源,而不是任何其他資源,如圖像,腳本和樣式表。

+0

Thank you kind sir – Ron