這裏是我的字符串:刪除HTML標籤使用的StringTokenizer
String str = "<pre><font size="5"><strong><u>LVI . The Day of Battle</u></strong></font>
<font
size="4"><strong>";
我想刪除所有的HTML標籤的字符串使用StringTokenizer
。但我不明白如何在這種情況下使用StringTokenizer。因爲當我使用str.replaceAll("\\<.*?>","")
時,刪除所有標記效率不高,因爲某些標記將位於字符串的下一行,如上面的字符串所示。但我想要在<
和>
之間的所有情況下執行此操作。我該怎麼做? (我想用StringTokenizer
實現它)。謝謝..
A)你不應該使用'StringTokenizer'。正如文檔所述,這是一個遺留類。B)試圖用正則表達式解析HTML是徒勞的。 – 2012-03-02 23:29:38
@BrianRoach還有另外一個用於刪除html標籤的庫JSon,但我無法使用其他庫,並且似乎沒有其他方法來實現它。 – El3ctr0n1c4 2012-03-02 23:32:57
爲什麼你不能使用其他庫? – DNA 2012-03-02 23:43:28