有一些網站 - www.elections.am/votersreg ,我想知道如何在本網站使用linux wget標籤獲取整個信息? 感謝使用Linux wget標籤來抓取網站
0
A
回答
1
可以使用wget -r
或安裝一個名爲「的HTTrack」程序,並用它來的URL鏡像到一個文件夾
+0
試試webhttrack。 –
0
另一個答案建議「的wget -r」這可能爲你工作。但是,爲了最好地「抓住本網站的所有信息」,如你的問題所述,我認爲'wget --mirror'或者'wget --mirror --convert-links'將是更強大的解決方案。 -r選項默認爲遞歸的5個級別,其中--mirror提供無限級別的遞歸。 --convert-links選項將根據需要轉換下載文檔中的鏈接,以使其適合本地瀏覽,如果這是您的目標。
我會在這裏的'無限遞歸'方面小心。這可能會失控,因此您可能需要監視下載進度。您還可以使用--level = depth選項顯式定義遞歸深度。
相關問題
- 1. 使用wget優化網頁抓取
- 2. 使用wget抓取網站並限制已抓取鏈接的總數
- 3. 使用python來抓取一個網站
- 4. 使用curl和xpath來抓取網站
- 5. 使用Python網頁抓取particualr標籤
- 6. 抓取網站使用PHP
- 7. 使用linux的wget從窗口抓取數據框
- 8. 使用wget提取元標籤屬性
- 9. scrapy抓取網站
- 10. NodeJS Xray無法抓取到多個網站來抓取數據
- 11. 使gwt網站可以不使用散列符號來抓取?
- 12. 使用wget抓取整個tumblr?
- 13. 網站抓取器每隔幾秒就抓取一次網站
- 14. 嵌套標籤網頁抓取python
- 15. 使用Scrapy遞增抓取網站
- 16. 使用Angular js抓取網站
- 17. 順序抓取網站使用scrapy
- 18. 網站抓取使用zombie.js的問題
- 19. 使用xcode從網站抓取文本
- 20. 建議使用抓取網站內容
- 21. 使用動態頁面抓取網站
- 22. 如何使用scrapy抓取網站?
- 23. 安裝抓取,網站抓取庫
- 24. 如何使用Scrapy和Splash來抓取基於AJAX的網站?
- 25. 如何使用scrapy來抓取網站中的所有項目
- 26. 網站抓取問題網站
- 27. 使用R中的函數來抓取網站,返回「下標越界」錯誤
- 28. 如何使用Asp.net抓取過程來獲取網站的所有網址?
- 29. Scrapy:抓取使用document.write填充目標項目的網站
- 30. apache nutch不抓取網站
什麼是「標籤」? – 2012-10-03 21:00:15
也許這是指一個「命令」的奇怪方式? – duskwuff
如果你想做一些很酷的東西使用perl和嵌入的LWP :: Simple,你可以加載網站,如果你需要更多的智能perl也包含一些www庫來輸入內容並提交它。 http://search.cpan.org/~gaas/libwww-perl-6.04/lib/LWP/Simple.pm –