我使用wget -p $url
來獲取網頁上的所有文件,以便我可以得到一個列表。但是對於一些URL,事實證明只有index.html可以被wget獲取。有沒有辦法通過wget或cURL獲取特定URL上的文件列表?我需要檢查請求標頭和響應標頭嗎?如何使用wget或curl在php中獲取網頁上所有路徑/文件的列表?
0
A
回答
2
某些服務器不允許您瀏覽目錄列表,並且如果該目錄中有默認文檔,它將接管並且您無法瀏覽。
你需要實現一個蜘蛛來解析所有的路徑,文件和鏈接,並創建一個在HTML中聲明和使用的文件的目錄結構。 然後你可以下載這些文件。
+0
您可以在頁面上輸入一些網址:http://tools.pingdom.com,文件列表就是我想要的。你知道我怎麼能得到這種類型的所有文件列表? –
相關問題
- 1. 如何使用wget或curl獲取可用文件的列表?
- 2. 獲取網頁上加載的所有JS文件的列表
- 3. 如何獲取網頁上的所有文件和網址列表
- 4. 如何獲取g ++列出所有#included文件的路徑
- 5. PHP:如何使用cURL獲取網頁的基準網址
- 6. 如何使用python selenium獲取網頁上的所有表單?
- 7. 如何使用wget/curl下載指定網頁上的.zip文件的所有鏈接?
- 8. 下載沒有wget或curl的文件
- 9. 如何從php文件中使用javascript獲取file_get_contents的路徑
- 10. 使用BeautifulSoup獲取頁面中所有圖像的絕對路徑列表
- 11. 如何獲取Documents目錄中文件的所有路徑?
- 12. 使用curl或wget的
- 13. 如何用共同路徑預先列出列表上的所有文件名?
- 14. 如何使用wget獲取csv文件
- 15. 如何在PHP中上傳文件時獲取完整的文件路徑?
- 16. 如何在文件上傳時在php中獲取文件臨時路徑
- 17. WGET或cURL來獲取文件的保護
- 18. AppleScript:獲取POSIX路徑到文件夾中的所有文件
- 19. 如何獲取沒有上下文路徑的php請求URI?
- 20. 如何獲取類路徑中的包和/或類的列表?
- 21. 如何使用JavaScript或...獲取文件絕對路徑?
- 22. 如何在PHP中獲取文件的路徑?
- 23. 如何在PHP中獲取文件路徑的結尾?
- 24. 如何使用pyqt5從文件路徑中獲取文件路徑?
- 25. 如何在NetBeans中獲取WAR中的網頁路徑?
- 26. 如何獲取網頁上出現的所有圖片的網址列表?
- 27. 如何在Go中的目錄中獲取所有文件的完整路徑?
- 28. 如何使用php獲取文件輸入框路徑
- 29. 在PHP中獲取文件上載字段的完整路徑
- 30. 如何獲取所選文件的文件路徑?
如果你能舉一些例子,你會得到更好的答案。鏈接看起來像wget沒有遵循的是什麼? –
@Pekka,例如:wget -p amazon.com,我只獲得index.html。 –
「網頁上的文件」究竟是什麼意思? 'wget -p'加載所有先決條件,即。附着的樣式表等。那是你要的嗎? –