從Apache和Java中通過HttpClient4發出的請求獲得Html頁面的一部分的最佳方式是什麼?具體而言,我需要一個表格(它的內容)。
說明,示例或鏈接會很好。如何只獲取HTML頁面的一部分?
0
A
回答
2
你可以做的是從響應中創建一個DOM對象,因爲它應該是一個有效的文檔。
這樣做
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(/* your input stream from response */);
Element tableElement = document.getElementById("the-table-id");
1
阿德里安·羅德里格斯」的方式也不錯,但不幸的是,如果HTML爲XHTML(即格式正確XML)它只會工作。您可以使用名爲Web Harvest的庫(可在sourceforge.net上獲得)來抓取頁面並以聲明方式提取表格,而不是編寫代碼來執行此操作。它還包含構建腳本中的階段,用於根據需要清理頁面。我強烈建議使用它,因爲它會是一個更強大的解決方案,尤其是在將來您需要刮取其他頁面時。
相關問題
- 1. 如何用PHP獲取頁面的HTML DOM的一部分?
- 2. 提取HTML頁面的一部分
- 3. 如何在另一頁獲取外部頁面的HTML
- 4. 獲取頁面URL的一部分
- 5. 如何獲取CSS文件隻影響HTML的一部分
- 6. wp-admin頁面只輸出部分html
- 7. Jsoup獲取部分頁面
- 8. Chrome擴展程序:如何在頁面上獲取html的一部分?
- 9. Colorbox:只顯示另一個html頁面的一部分
- 10. 如何避免獲取在另一頁面內被調用的html頁面的一部分?
- 11. 如何獲取MediaWiki頁面標題的一部分?
- 12. 如何使用AnyEvent :: HTTP獲取頁面的一部分?
- 13. 如何使用PHP獲取頁面內容的一部分?
- 14. 用jQuery的.post()方法只選擇HTML頁面的一部分?
- 15. 如何只緩存部分頁面
- 16. 如何下載只有部分html頁面
- 17. 如何在MVC的另一個頁面中顯示html頁面的一部分
- 18. 打開html頁面的一部分
- 19. 打印html頁面的一部分
- 20. 如何獲取當前頁面的html?
- 21. 我如何獲取頁面的html?
- 22. 如何獲取html頁面的標題
- 23. 如何在另一個html頁面中呈現html部分?
- 24. 如何在HTML頁面中只打印響應對象的一部分
- 25. 如何翻譯只有一部分的HTML頁面與國際化
- 26. 通過AJAX獲取頁面HTML的部分
- 27. 使用iPhone SDK獲取HTML頁面的特定部分?
- 28. 從頁面中代碼的隱藏部分獲取HTML
- 29. 獲取html頁面
- 30. 如何在php中獲取部分從jquery加載的頁面的整個html