回答
jsoup, Java HTML Parser與jQuery的語法方式非常相似。
它是否執行XPath查詢? – 2010-07-30 01:08:20
我不確定。它執行更簡單的查詢,這是基於xpath的。你可以閱讀一些文檔,並且有很多很酷的例子,解釋如何運行這些查詢。 – 2010-07-31 08:17:56
jsoup(至少在版本1.7.3中)不支持XPath。 – prasopes 2014-01-11 20:30:22
我已經使用JTidy將HTML製作成適當的DOM,然後使用普通的XPath來查詢DOM。
如果您想要進行跨文檔/跨URL查詢,最好將JTidy與XQuery一起使用。
去嘗試一下。 – 2010-07-30 01:09:05
您可以使用TagSoup與撒克遜一起。通過這種方式,您可以簡單地替換任何與TagSoup一起使用的XML SAX解析器,XPath 2.0或XSLT 2.0或XQuery 1.0實現像往常一樣工作。
即將嘗試。 – 2010-07-30 01:08:47
有幾種不同的方法來此文件在網絡上:
- HtmlCleaner/Java的DOM解析器 - Using XPath Contains against HTML in Java(這是我的方式推薦)
- HtmlCleaner本身具有內置支持XPath的實用程序 - 查看javadocs http://htmlcleaner.sourceforge.net/doc/org/htmlcleaner/XPather.html或本示例http://thinkandroid.wordpress.com/2010/01/05/using-xpath-and-html-cleaner-to-parse-html-xml/
使用Jericho
我曾嘗試這些方法,即的HTMLParser加上Java的DOM解析器,並JSoup加Jaxen的,但效果最好的組合的幾個不同的變化是HtmlCleaner加上Java DOM解析器。下一個最好的組合是傑里科加Jaxen。
- 1. 查詢的HTML頁面使用XPath在Java中
- 2. 使用Xpath在iOS中查詢HTML
- 3. 的Java Xpath查詢
- 4. 從Java中的XPath查詢中檢索裸露的html
- 5. HTML 4.0實體XPath查詢
- 6. XPath查詢返回HTML
- 7. 的Java Xpath查詢失敗在編譯
- 8. 與蟒蛇LXML使用XPath查詢HTML
- 9. 使用XPath查詢HTML文檔
- 10. 使用XPath查詢html標記
- 11. 數據庫XPath查詢
- 12. XPath查詢和HTML - 在錨標籤中查找特定的HREF
- 13. 使用xpath查詢讀取xml java
- 14. HTML頁面上的Xpath查詢 - 語法?
- 15. 格式錯誤的HTML和XPath查詢
- 16. 使用XPath在Java中使用Android SDK查詢xml資源
- 17. XPath查詢中使用Python
- 18. 使用XPath查詢
- 19. XPath查詢中值
- 20. XPath查詢SimpleXML中
- 21. XPath查詢在JRXML
- 22. 將XPath查詢應用到Java中的SOAPMessage中
- 23. 在XPath查詢中使用條件
- 24. 在xpath查詢中使用php變量
- 25. Dom和xpath查詢爲html解析
- 26. T-SQL查詢中的XPath
- 27. JMeter中的XPath查詢
- 28. C++中的Xpath查詢
- 29. SimpleXML中的XPath查詢
- 30. 在java中使用xpath查找節點
請參閱http://stackoverflow.com/questions/9022140/using-xpath-contains-against-html-in-java-不完全重複,因爲它會詢問特定的XPath功能,但那裏有更好的答案。 – 2013-01-07 00:34:58
@Reonarudo我和你問這個問題時的情況一樣。答案中有很多可能的建議/解決方案,但我想知道您使用了哪種解決方案(庫),是否按照您希望的方式工作? – 2015-06-20 19:08:10
@UtherPendragon對不起,但這是很久以前,我不記得哪個項目是這樣的。無論如何,現在應該有更新/更好的圖書館。 – 2015-06-23 12:14:52