2012-08-11 26 views
4

我嘗試從用戶提供的URL(當然有一個深度限制集)遞歸地鏡像網頁。 Wget沒有捕獲來自css/js的鏈接,所以我決定使用httrackhttrack跟着重定向

我儘可能反映一些這樣的網站:

# httrack <http://onet.pl> -r6 --ext-depth=6 -O ./a "+*" 

本網站使用了重定向(301)http://www.onet.pl:80,剛剛的HTTrack下載 index.html頁面有:

<a HREF="onet.pl/index.html" >Page has moved</a> 

,僅此而已!當我運行時:

# httrack <http://www.onet.pl> -r6 --ext-depth=6 -O ./a "+*" 

它做我想要的。

有沒有什麼辦法讓httrack跟着重定向?目前,我只是將「www。」+ url添加到httrack的URL中,但它不是真正的解決方案(不包括所有用戶案例)。有沒有更好的網站鏡像工具的Linux?

回答

3

在主要的高速公路forum之一的開發人員說這是不可能的。

正確的解決方案是使用另一個網頁鏡像工具。

+4

你能推薦任何遵循重定向的網頁鏡像工具嗎? – user 2015-03-27 17:20:13