2010-12-10 48 views
0

我正在使用正則表達式模式,我需要檢查該字符串的開頭是否爲HTML簡單文本並返回該字符串。因此,例如:Java中的正則表達式模式

Hello World!<TAG> &nsbp; 

應返回:

Hello World!

+0

如果您解析HTML,則應使用HTML解析器。 – 2010-12-10 23:58:33

+0

http://stackoverflow.com/questions/701166/can-you-provide-some-examples-of-why-it-is-hard-to-parse-xml-and-html-with-a-rege – 2010-12-11 01:33:38

+0

「拆分「需要一個正則表達式作爲第一個參數 – thejh 2010-12-11 10:41:18

回答

3

請記住,如果您正在解析大段文本或整個文件,則應該強制字符串進入新的引用,否則可能會由於子字符串而導致內存泄漏。

new String("Hello World!<TAG> &nsbp;".split("<")[0]) 
+0

THANKs爲響應,但我需要使用正則表達式 – 2010-12-11 01:19:24

+0

如果您檢查String.split的API,技術上它是一個正則表達式:) – 2010-12-11 12:15:38

0
"Hello World!<TAG> &nsbp;".split("<")[0] 

應該返回Hello World!