我需要用一個簡單的表單解析一個簡單的HTML頁面。對StackOverflow類似問題的答案建議使用各種非標準Java庫之一,如TagSoup,JSoup,HTMLParser等等。是否有標準的Java SE HTML解析器?如果是這樣,爲什麼使用非標準的?
然而,在網上搜索發現,有通過這個類存在於Java SE的一些標準功能:http://docs.oracle.com/javase/7/docs/api/javax/swing/text/html/parser/ParserDelegator.html
我的子問題是:
- 難道真的是標準的ParserDelegator類可以解析像我這樣的用例?
- 標準庫的侷限性是如何創建這麼多非標準庫的需求?
- ParserDelegator在擺動範圍內的事實是否排除在Web應用程序的常規EC2雲服務器中使用它?我是否需要跳過很多環節才能解決無頭的問題,或者只是對組態進行一些小調整? (a)我希望不偏離標準;(b)我希望不偏離標準;(c)我希望不偏離標準;(c)我希望不偏離標準; (b)我的簡單用例; (c)渴望成熟可靠的實施;和(d)沒有尺寸或重量的限制,因爲這是一個服務器應用程序,而不是嵌入式客戶端。 API是一個低得多的優先級,所以雖然我非常欣賞JSoup的CSS選擇器,但API(a)到(d)的其他關注點覆蓋了它。
謝謝。
接近選民(或多個),請點什麼,這是一個重複的(如果這是你的理由接近的選票) – necromancer 2012-01-31 07:23:04