2012-01-10 186 views
0

我現在正在構建蜘蛛,我正在研究如何以字節爲單位測量網頁總重量。通過我的研究,我發現了這個問題,最簡單的答案是獲取頁面的內容長度。但是有一個小問題,以字節爲單位的內容長度並沒有告訴我們應該下載到瀏覽器的臨時文件夾的圖像,也沒有告訴我們任何有關應該下載到瀏覽器的臨時文件夾的圖像,也不是來自頁面標題的JavaScript或CSS鏈接。所以我實際上支持了我的結論,關於如何實際測量頁面,需要從服務器向客戶端發送多少字節,以確保weppage正常工作所需的所有資源,而不是僅測量字節只有文件。 所以我做了資源的列表,一個網頁瀏覽器應該下載當訪問一個頁面:瀏覽網頁時,瀏覽器是否會下載可能的資源列表?

all images <img src="someimages.jpg" alt=」somedecription」 > 
all js files <script type="text/javascript" src="somejs.js" ></script> 
all css files <link rel="stylesheet" type="text/css" href="somecss.css"> 
the ico file <link rel="shortcut icon" href="someico.ico"> 

是否有瀏覽器具有當它訪問該網頁下載任何其他資源?換句話說,瀏覽器在訪問網頁時下載的所有可能資源的列表是什麼?

+1

視頻怎麼樣?壓縮文件?具有不同擴展名的圖像(.png,.jpeg,.tiff,.gif等)? – 2012-01-10 18:03:46

+0

好的壓縮文件是一個資源,我可以找到它,如果它可以通過download link訪問,也可以從 themis 2012-01-10 18:08:38

+0

are you going to extract the '