回答
要過濾特定文件擴展名:
wget -A pdf,jpg -m -p -E -k -K -np http://site/path/
或者,如果你喜歡長選項名稱:
wget --accept pdf,jpg --mirror --page-requisites --adjust-extension --convert-links --backup-converted --no-parent http://site/path/
這將反映該網站,但沒有jpg
或pdf
擴展名的文件會自動刪除。
wget -m -p -E -k -K -np http://site/path/
手冊頁會告訴你這些選項是做。
wget
只會跟隨鏈接,如果沒有鏈接到索引頁中的文件,那麼wget
將不知道它的存在,因此不會下載它。即。如果所有文件都鏈接到網頁或目錄索引中,它會有所幫助。
感謝您的回覆:) 它複製整個網站,我只需要文件(即txt,pdf ,圖片等)在網站 – Aniruddhsinh 2012-01-06 09:05:26
此下載整個網站對我來說:
wget --no-clobber --convert-links --random-wait -r -p -E -e robots=off -U mozilla http://site/path/
+1 for'-e robots = off'!這終於解決了我的問題! :)謝謝 – NHDaly 2013-12-22 18:35:16
+1,做了我想要的。完美的鏡像 – Anon343224user 2013-12-24 23:20:20
'--random-wait'選項是天才;) – poitroae 2014-02-05 23:11:09
你可以試試:
wget --user-agent=Mozilla --content-disposition --mirror --convert-links -E -K -p http://example.com/
你也可以添加:
-A pdf,ps,djvu,tex,doc,docx,xls,xlsx,gz,ppt,mp4,avi,zip,rar
接受特定的擴展,或僅拒絕特定的擴展名:
-R html,htm,asp,php
或排除的具體領域:
-X "search*,forum*"
如果文件被機器人忽略(如搜索引擎),你還補充:-e robots=off
我試圖下載從Omeka's themes page鏈接的zip文件 - 非常相似的任務。這爲我工作:
wget -A zip -r -l 1 -nd http://omeka.org/add-ons/themes/
-A
:只接受zip文件-r
:遞歸-l 1
:深度只有一層(即僅將文件直接從這個頁面鏈接)-nd
:不要創建目錄結構,只需將所有文件下載到此目錄中即可。
所有的答案-k
,-K
,-E
等選項可能還沒有真正理解這個問題,因爲這些對於重寫HTML頁面來進行局部結構,重命名文件.php
等。不相關。
要字面上得到的所有文件除了.html
等:
wget -R html,htm,php,asp,jsp,js,py,css -r -l 1 -nd http://yoursite.com
'-A'是區分大小寫的,我認爲,所以你將不得不做'-A zip,ZIP' – Flimm 2014-11-21 18:56:25
試試這個。它總是對我的作品
wget --mirror -p --convert-links -P ./LOCAL-DIR WEBSITE-URL
wget -m -A * -pk -e robots=off www.mysite.com/
這會從HTML文件 下載本地的所有類型的文件,並指向他們,這會忽略robots文件
- 1. 使用WGET從網站/目錄下載所有.tar.gz文件
- 2. 如何使用wget從網站下載所有圖像?
- 3. 如何僅使用wget從網站下載.exe文件?
- 4. 使用wget下載所有pdf文件
- 5. 使用wget從網站下載特定類型的所有文件
- 6. 如何使用wget在網站上下載最新的文件?
- 7. 從網站下載所有PDF文件
- 8. 如何使用wget一次下載所有這些文件?
- 9. 如何使用wget從網站下載圖片
- 10. 我有一個網站的鏈接如何從網站下載所有文件?
- 11. Wget - 從第二深度下載網站
- 12. 使用wget從網頁下載所有數據
- 13. 下載的所有文件在網站
- 14. 使用wget下載文件
- 15. 使用Python從網站下載文件
- 16. 使用python從網站下載文件
- 17. 如何使用PHP從網站下載所有特定類型的文件?
- 18. 如何使用wget下載xhtml網頁
- 19. 如何使用Wget下載網頁?
- 20. SILVERLIGHT。如何從網站下載文件
- 21. 如何從C#網站下載文件?
- 22. 如何從網站下載.cs文件?
- 23. 如何從網站下載文件?
- 24. 下載通過wget的不特定文件夾中的網站
- 25. 從網站下載文件
- 26. 從網站下載文件
- 27. 如何使用--accept-regex選項通過wget下載網站?
- 28. 如何使用wget將大量zip文件下載到網址
- 29. wget從一個自定義網站下載PHP加載的所有圖像
- 30. 使用wget從網頁下載圖像
即使你想要下載PHP,它使用wget是不可能的。我們只能使用wget獲取原始HTML。我猜你知道原因 – 2013-09-26 16:35:45
**注意:**總是首先檢查'wget --spider',並且總是添加'-w 1'(或更多的'-w 5'),這樣你就不會淹沒其他人的服務器。 – isomorphismes 2015-03-06 00:34:29
我該如何下載本頁面中的所有pdf文件? http://pualib.com/collection/pua-titles-a.html – Arturo 2015-11-16 08:56:48