2012-02-22 28 views
0

這是個好主意嗎?那麼我已經使用了像JSoup這樣的其他第三方庫,它效果很好,但是對於這個項目來說它是不同的。當您只想從中獲取一個項目時,是否值得加載和解析整個文檔?一些html頁面也很簡單,所以我也可以使用String方法。原因是導致內存將成爲問題,並且也需要一些時間來加載文檔。當解析XML我一直使用SAX解析器,因爲它不會在內存中加載它,它是快速的。我可以在html文檔上使用相同的東西嗎,或者在那裏已經有這樣一個?所以如果有一個非DOM的HTML輕量級解析器,那也會很棒。使用純String方法的Java Parser HTML?

+0

只是一個念頭,也許是操作系統可以爲您更快做的工作,如果你正在尋找一個字符串。某種與正則表達式的grep,取決於您的環境 – 2012-02-22 19:35:41

+0

那麼它的主要將是在Android的 – 2012-02-22 20:02:55

+0

我真的不知道關於Android任何事情,但我沒有找到[這裏](http://www.freeyourandroid.com/guide/ Linux的UNIX殼命令,Android)和[這](http://forum.xda-developers.com/showthread.php?t=1509517) – 2012-02-22 21:17:15

回答

1

如果HTML是XML標準(即它的XHTML),那麼你可以使用標準的SAX解析器。在這裏,你可以找到在Java的HTML解析器的列表可供選擇:http://java-source.net/open-source/html-parsers。 HotSax可能會處理您的所有用例。

+0

感謝我會給那些一試 – 2012-02-23 01:52:55

相關問題