2012-01-25 22 views
0

是否有可能獲取頁面的Dom視圖,例如,與查看源相比,單擊檢查元素時在Chrome中看到的內容。我需要通過java來訪問它,目前我只能獲得源代碼。檢索Java中的網頁的DOM視圖不僅僅是源

謝謝你們。

+0

創建瀏覽器插件會不會更容易? –

回答

0

恕我直言,你也必須遵循鏈接......所以一旦你有源代碼,你需要解析它。然後,您可以在原始DOM中插入鏈接的內容(如CSS或腳本)。

0

HTML可能很混亂。在過去,我使用TagSoup解析HTML並以SAX事件流的形式生成XML,然後使用JDOM構建XML的內存中DOM類樹形版本,該版本運行良好。然後,您可以使用其他庫如Saxon對該XML樹執行xpath,xslt或xquery。

+0

它實際上是從Hypem站點拉出一些URL,但是它會從插件中重新生成dom,所以我需要獲取新的樹。似乎直接從chrome獲得它的唯一方法。 – user1170314

+0

我會檢查URL是在初始頁面加載還是來自某個AJAX調用。當您點擊「inspect element」查看AJAX請求和HTML/JSON /返回的任何響應時,您可以使用Developer Tools中的網絡選項卡。您可以創建一個小HTTP請求,模仿AJAX請求,直接從網站獲取信息而不涉及瀏覽器。 –

相關問題