2015-05-04 78 views
3

我使用wget下載整個網站。
我用follwing命令(在Windows 7):如何恢復wget鏡像網站?

wget^
--recursive^
-A "*thread*, *label*"^
--no-clobber^
--page-requisites^
--html-extension^
--domains example.com^
--random-wait^
--no-parent^
--background^
--header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0"^
    http://example.com/ 

2天后,我的小兄弟重新啓動PC
所以我試圖恢復已停止的進程
添加以下到命令

--continue^

,使代碼看起來像

wget^
    --recursive^
    -A "*thread*, *label*"^
    --no-clobber^
    --page-requisites^
    --html-extension^
    --domains example.com^
    --random-wait^
    --no-parent^
    --background^
    --continue^
    --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0"^
     http://example.com/ 

不幸的是它再次啓動它下載相同文件創建一個新的工作,並編寫了一個名爲

wget-log.1 

一個新的日誌文件,反正是有恢復鏡像網站與wget的或確實有我要重新開始整個事情?

回答

2

嘗試-nc選項。它再次檢查所有內容,但不會下載它。

我使用此代碼下載一個網站: wget -r -t1 domain.com -o log

我已經停止的過程中,我想重新開始,所以我改變了代碼: wget -nc -r -t1 domain.com -o log

在日誌中有是這樣的: File .... already there; not retrieving. etc.

我在此之前檢查日誌,似乎在這種類型的檢查5分鐘後,它開始下載新文件。

我正在使用wget的本手冊:http://www.linux.net.pl/~wkotwica/doc/wget/wget_8.html