回答
恕我直言,你也必須遵循鏈接......所以一旦你有源代碼,你需要解析它。然後,您可以在原始DOM中插入鏈接的內容(如CSS或腳本)。
HTML可能很混亂。在過去,我使用TagSoup解析HTML並以SAX事件流的形式生成XML,然後使用JDOM構建XML的內存中DOM類樹形版本,該版本運行良好。然後,您可以使用其他庫如Saxon對該XML樹執行xpath,xslt或xquery。
它實際上是從Hypem站點拉出一些URL,但是它會從插件中重新生成dom,所以我需要獲取新的樹。似乎直接從chrome獲得它的唯一方法。 – user1170314
我會檢查URL是在初始頁面加載還是來自某個AJAX調用。當您點擊「inspect element」查看AJAX請求和HTML/JSON /返回的任何響應時,您可以使用Developer Tools中的網絡選項卡。您可以創建一個小HTTP請求,模仿AJAX請求,直接從網站獲取信息而不涉及瀏覽器。 –
- 1. 僅檢索HTML頁面
- 2. 檢索整個對象的加入而不僅僅是性能
- 3. 檢查文件是否存在,而不僅僅是網址
- 4. 在頁面加載樣式表(不僅僅是DOM)時觸發的事件
- 5. 獲取整個Google地圖網頁源代碼而不僅僅是生成的KML文件來解析
- 6. MVC3 WebGrid打印整個網格值而不僅僅是頁面
- 7. setTimeout爲整個網站,而不僅僅是一個頁面
- 8. 僅從DOM存儲和檢索信息被認爲是不好的做法嗎?
- 9. MVC局部視圖返回整個頁面,而不僅僅是部分
- 10. 檢索Google Map的所有標記(不僅僅是當前登錄的用戶)
- 11. 檢索單值僅
- 12. 僅根據網址檢索ID
- 13. 從網頁檢索HTML源
- 14. 使用JUI檢測圖像中的黑色圓圈(不僅僅是像素)
- 15. 不僅僅是EXC_BAD_ACCESS?
- 16. 的Java:XML DOM解析檢索僅有1陣列
- 17. 檢索Neo4j Lucene每個文檔的分數,而不僅僅是訂單
- 18. 發送的圖像不僅僅是來自Android的blobstore的上傳網址?
- 19. 從java中的網頁檢索URL
- 20. 如何在我的寧靜報告(而不僅僅是視口)中包含完整頁面的屏幕截圖?
- 21. 如何獲得整個網頁的寬度,而不僅僅是窗寬
- 22. 查看不僅僅是Android中的圖像旋轉木馬
- 23. 僅支持帶視網膜圖像的iPad非視網膜
- 24. 如何僅檢索SQLite中的域名?
- 25. 適用於定位的iTunes API,而不僅僅是搜索?
- 26. 視頻不僅
- 27. 任何創建(而不僅僅是檢查)RegEx的工具?
- 28. 僅檢測Java中的紅色像素
- 29. 僅從YouTube API中檢索移動設備支持的視頻
- 30. 停止僅使用視網膜圖像
創建瀏覽器插件會不會更容易? –