2010-01-22 65 views
0

我是一個新的bie來java.i有一個問題,我需要保存一個完整的網頁(像它的所有內容,如圖像,CSS,JavaScript等),就像我們可以做的另存爲 - >完整的網頁選項與HttpClient lib.plese告訴我一個方法如何做到這一點。使用httpclient回顧完整的網頁

回答

0

您必須編寫獲取的HTML文件,分析它,並提取所有引用的應用程序,然後獲取解析發現的所有文件。

0

這並不容易,因爲一些CSS/JS/Images文件路徑可能是「隱藏」的。只是考慮下面的例子:

<script type="..."> 
    document.write("&bla;script" + " type='...' src='" + blahBlah() + "'&bla;" + "&bla;/script&bla;"); 
</script> 

然而,獲取頁面的源代碼,解析在搜索網址和下載網址成立是你可能需要相當的一切。