我有一個Java分配來製作一個簡單的GUI Web瀏覽器,它接收URL的主機名和文件路徑,並通過套接字將其發送到Web服務器。然後Web服務器返回網頁的內容。將這些數據轉換爲字符串後,我需要先刪除<body>
和</body>
標記之外的所有內容,然後刪除這些內容中的所有標記,以僅顯示用戶想要查看的文本內容。我試圖使用string.split
方法在<body>
和</body>
之後進行兩次拆分,但出於某種原因,我得到了一個超出界限的異常。我很推動時間,所以如果有人知道一個簡單的方法來做到這一點,我將不勝感激。如何修剪網頁的HTML以移除標籤並僅在Java中顯示文本內容?
1
A
回答
0
0
不要用分裂/正則表達式的HTML數據。如果你想正確地使用HTML,有幾乎幾乎需要使用的庫。
這種最知名的圖書館之一是JSoup。當您將它集成到你的項目,你可以得到你的元素,例如數據這樣
Document doc = Jsoup.parse(html); //where html is your source
Element divs = doc.select("div");
for(Element div : divs){
System.out.println(div.text());
}
有很多自己的頁面上示例和教程。請務必查看their cookbook。
相關問題
- 1. 修剪標籤中的顯示內容
- 2. Java:如何從HTML標籤中去除文本內容?
- 3. 如何在php中顯示xml內容後刪除html標籤?
- 4. 如何在網頁中顯示.html文件的內容?
- 5. Wordpress,修剪跨度標籤周圍顯示的內容
- 6. 如何從asp.net網格視圖中的文本中修剪html標籤?
- 7. 如何在SPSecurityTrimmedControl修剪內容時顯示其他內容
- 8. 在ZK中如何在標籤中顯示html內容?
- 9. 我如何獲得網頁的內容並將其顯示在文本框中
- 10. 在html頁面內顯示標籤
- 11. 顯示標籤的HTML內容
- 12. 修剪html文本c#的一部分,但不修剪html標籤
- 13. 在標籤Wicket中顯示HTML標籤和內容
- 14. Razor - 如何在div標籤中顯示html內容?
- 15. 使用JSON文件中的html標籤閱讀內容並在javascript中顯示
- 16. 如何隱藏其他標籤內容並僅顯示帶有JQuery的選定標籤內容?
- 17. 在html文檔中顯示xml標籤內容
- 18. 用html標籤顯示xml內容
- 19. 在java中修剪文本
- 20. 如何在Rails視圖中顯示內容並排除幾頁?
- 21. 如何從網頁上的JavaScript文件中移除html標記?
- 22. 如何從解析的文本中移除HTML標籤?
- 23. 我如何顯示HTML標籤中的文本在黃金色
- 24. 刪除內容並顯示JAVA中的所有內容
- 25. 如何刪除html標籤,並在C#中留下文本?
- 26. 網址標籤內刪除HTML標籤
- 27. 如何用C#替換HTML標籤內部的文本內容!
- 28. 在Perl中刪除包含標籤本身的HTML標籤中的內容
- 29. 顯示meta標籤的內容作爲網頁
- 30. 如何在Excel中修剪超鏈接的顯示文本
這將有助於,如果我們知道你的GUI網頁瀏覽器是寫在.. – Winter 2014-10-20 04:52:05
哎呀。我很匆忙。 Java – Kyle 2014-10-20 05:01:11
看看這裏:http://stackoverflow.com/a/8282951/2696690 – Winter 2014-10-20 05:05:59