2014-11-23 126 views
0

我試圖讓包括圖像,CSS & JavaScript的網頁總規模...PHP獲取網頁的大小,包括圖片,CSS和Javascript

我注意到了一些東西飛輪像curl請求,然後使用curl_info顯示已下載了多少數據...這工作正常,但它不包括所有圖像,css & javascript。

$curl = curl_init('http://www.dailymail.co.uk/news/article-2844384/It-s-mini-adventure-Astonishing-moment-frustrated-passengers-lift-Mini-way-tram-driver-parked-car-tracks.html'); 
curl_setopt($curl, CURLOPT_RETURNTRANSFER, TRUE); 
curl_exec($curl); 
//get the download size of page 
print("Download size: " . curl_getinfo($curl, CURLINFO_SIZE_DOWNLOAD) .'<br>'); 

這將返回381.285 kb,但tools.pingdom.com會回退超過5MB。

任何人都可以幫助我解決這個問題。

感謝

+0

喲你的捲曲只是越來越容易的部分,HTML。您將不得不處理該html中引用的所有資源文件。看看使用無頭瀏覽器 – charlietfl 2014-11-23 13:17:41

+0

像phantomjs? – WebDevB 2014-11-23 13:48:03

回答

0

如果通過捲曲你剛纔看到的網頁,你必須得到每個圖像,CSS & JavaScript的,例如你使用的preg_match每個版本,SRC等 例如:

$pattern = '/src="(.*)" /'; 
preg_match($pattern, substr($subject,3), $matches, PREG_OFFSET_CAPTURE); 
getcurlsize($matches[1][0]); 

$主題是你已經得到的頁面內容

getcurlsize是你必須創建的函數來獲得捲曲文件的大小信息