我想一個HTML網頁的完整的源代碼加載到Java中的String
的全部源代碼。我嘗試了幾種方法,但是,我幾乎獲得了所有的源代碼。更糟糕的是:我沒有得到的主要部分之一是我最需要的部分!爪哇 - 如何加載HTML網站
3
A
回答
6
URL url = new URL("http://www.website.com");
URLConnection spoof = url.openConnection();
//Spoof the connection so we look like a web browser
spoof.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0; H010818)");
BufferedReader in = new BufferedReader(new InputStreamReader(spoof.getInputStream()));
String strLine = "";
String finalHTML = "";
//Loop through every line in the source
while ((strLine = in.readLine()) != null){
finalHTML += strLine;
}
5
這可能是因爲你正在尋找的內容實際上是動態加載,通過Ajax/JavaScript的。例如,一個網站可能包含一個空的DIV標籤,只有在頁面加載後(通過AJAX調用到另一個位置)纔會填充很多東西。
+0
在這種情況下,有一個很大的機會,'HtmlUnit'或類似的庫將能夠處理這些動態內容。 – bezmax 2012-03-23 22:58:47
相關問題
- 1. 爪哇 - 動態加載類
- 2. 爪哇 - 加載圖像
- 3. 爪哇 - 卸載類
- 4. 硒,爪哇,waitForCondition
- 5. 快速加載矩陣[numpy的/爪哇]
- 6. 爪哇 - 加載不同的地圖
- 7. 爪哇 - 無法加載文件的NoClassDefFoundError
- 8. 如何使用jquery加載網站HTML
- 9. 爪哇方法重載
- 10. 爪哇 - 對PMI
- 11. 逆陣列(爪哇)// Invertir陣列(爪哇)
- 12. 爪哇 - 如何更新JList的一次JFrame中已加載
- 13. 爪哇 - 我如何保存和加載使用db4o
- 14. 爪哇的StringIndexOutOfBoundsException
- 15. 爪哇 - 在
- 16. 爪哇ArrayList.contains()&添加()方法
- 17. 爪哇從
- 18. 在爪哇(ID3)
- 19. 爪哇Benfords法
- 20. 爪哇BigDecimal.doubleValue
- 21. 爪哇CryEngine 3
- 22. 爪哇 - 每行
- 23. 爪哇優化
- 24. 爪哇:enum toString()
- 25. 爪哇 - 並行
- 26. 爪哇mouseDragged邏輯
- 27. 爪哇 - 換行
- 28. 爪哇 - 可比
- 29. 爪哇 - 在Mac
- 30. 爪哇:checkPositionRow
你有我們的同情心,但是直到你向我們展示你的代碼並且更詳細地解釋你沒有收到的內容的性質,你纔會得到更多的東西。 – 2012-03-23 22:46:34
向我們展示你迄今爲止做了什麼,並更詳細地解釋。? – RanRag 2012-03-23 22:47:05
HTML網站是否公開?如果是這樣,你可以發佈一個鏈接? – mellamokb 2012-03-23 22:51:26