我想將動態生成的網頁的內容保存在文本文件中,以便在Linux下從bash腳本進一步處理。我對源代碼不感興趣;我想要的只是該頁面的輸出在本地保存(對應於Firefox中的Strg + S)。我嘗試了wget,curl ...和所有這些東西 - 但這隻保存了頁面的靜態部分。 有沒有一種簡單的方法可以通過命令行使用firefox或其他瀏覽器將其保存在文件中?用bash腳本在firefox中保存動態生成的網頁
1
A
回答
2
如果你想下載整個網站(比方說,www.google.com
),您可以使用wget
做到這一點:
wget --recursive --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names=unix --domains google.com --no-parent www.google.com
據this website,您可以用這些參數:
- - 遞歸:下載完整的網站
- --domains google.com:不要關注(因此下載)鏈接外部google.com
- - 無母公司:不要跟隨鏈接外部你打電話的文件夾(這意味着,如果你想下載
www.google.com/firefox
,你贏了沒有按照鏈接出現在這個firefox
文件夾中)。 - - 頁面必備條件:獲取頁面中的所有元素(CSS,圖像,腳本等)。
- --html-extension:用
.html
擴展名保存文件。 - - 轉換鏈接:將
http://site.domain/folder/doc.html
類型的鏈接轉換爲folder/doc.html
,因此它們將在本地工作。 - --restrict-文件名= UNIX:修改文件名(如果他們是怪異的)工作與UNIX命名規範完全兼容(這可能是
=windows
用於MS Windows文件系統,但我相信你使用的是UNIX兼容的操作系統)。 - --no-clobber:不要覆蓋現有文件(只下載缺失的內容)。
當然,如果你想下載另一個網站,你將需要相應地改變--domains
屬性。此外,wget
並不總是捆綁在所有與UNIX兼容的操作系統中(例如Mac OS X),但總是有安裝它的方法(常見的GNU/Linux發行版,如Ubuntu,Debian等,默認情況下包含它) 。
希望這會有所幫助。
+1
另外請注意,您可以使用'wget --mirror http:// www.google.com'來下載整個站點,但是如果您想自定義您的下載,上面顯示的選項使該命令更加強大。 –
相關問題
- 1. 使用bash腳本動態生成另一個bash腳本並運行它
- 2. 保存動態生成HTML頁面ASP.NET
- 3. 生成bash腳本
- 4. 在GWT中動態生成網頁
- 5. JSP動態網頁生成
- 6. 生成動態網頁的網址
- 7. 如何在網頁設計中動態生成文本區域
- 8. 可從網頁調用的Bash腳本
- 9. Bash shell腳本:動態生成數組變量
- 10. BASH動態命令生成
- 11. 保存動態生成的jqgrid列
- 12. 在ListView中保存動態生成的複選框狀態
- 13. 頁腳重疊動態生成表
- 14. Retrive其中一個bash腳本保存
- 15. 在bash腳本我想保存輸入
- 16. 在使用raw_input()時在bash中保存Python腳本的輸出
- 17. bash腳本中的自動完成
- 18. bash腳本,如何啓動firefox
- 19. 如何使動態或生成的HTML頁面可以保存?
- 20. 在vb.net中生成動態網頁和網址
- 21. 在AJAX動態生成網頁中使用JSR303驗證器
- 22. bash腳本控制生成的進程
- 23. 在Shell腳本中使用動態變量生成JSON
- 24. 從網頁保存動態內容?
- 25. 動態PHP網頁保存爲PDF
- 26. 如何使用bash腳本生成內存不足
- 27. Perl腳本動態監控網頁
- 28. 在bash腳本循環Firefox的標籤
- 29. 如何在動作腳本2.0中動態生成變量
- 30. 腳本不執行動態生成的JQuery腳本標記
你是什麼意思靜態的動態部分?當你在一個服務器中調用一個PHP文檔時,它會被評估並返回HTML(你可以看到它是「靜態的」,但有些部分可以動態生成)。使用命令'curl -o output.txt www.google.com'(或任何其他網站)將把服務器返回的HTML保存到'output.txt'文件中。 –
謝謝,但是:使用Firefox我可以保存一個網頁與「Strg + S進入」。我怎樣才能在腳本中做到這一點? – Josh
啊!你的意思是完全保存網站,包括圖片等?我認爲這是可能的,但很難做到。有一些使用'wget'的方法可以做到這一點(順便說一句,因爲你需要用英文寫問題,'Strg'鍵在英文中被稱爲'Ctrl'鍵)。 –