比方說,我有一個XML字符串<tagA>
許多OCCURENCES:Java的替代正則表達式的所有出現的與另一個正則表達式
String example = " (...) some xml here (...)
<tagA>283940</tagA>
(...) some xml here (...)
<tagA>& 9940</tagA>
<tagA>- 99440</tagA>
<tagA>< 99440</tagA>
<tagA>99440</tagA>
(...) more xml here (...) "
內容應該只包含數字,但它也有一個隨機字符後跟一個空格和數字。 我想刪除不需要的字符和空格。怎麼做?
到目前爲止,我知道我應該尋找一個正則表達式"<tagA>. [0-9]*<\/tagA>"
,但我被困在這裏。
我想更換,因爲這些字符中的人物有「&」,「>」,「<」的跡象,這使得該XML無效的(這讓我無法治療這種爲XML)。
[不要使用正則表達式解析XML(https://stackoverflow.com/questions/701166/can-you-provide-some-examples-of-why -it-is-hard-to-parse-xml-and-html-with-a-reg) – VGR
在謂詞中使用XPath和'starts-with'函數。 –
我無法解析XML,因爲它無效。 (&字符使xml無效) – Simon