我有這個java字符串與xml信息,我想用java正則表達式來過濾掉所有的單詞之間的垃圾,形成括號括起來的單詞,例如, [被告]。如何使用java正則表達式來過濾xml文件
我想從這個去:
<w:p><w:r><w:t>[</w:t></w:r><st1:PlaceName w:st="on"><w:r><w:t>DEFENDANT</w:t></w:r>
</st1:PlaceName><w:r><w:t> </w:t></w:r><st1:PlaceType w:st="on"><w:r><w:t>CITY</w:t></w:r>
</st1:PlaceType><w:r><w:t>], [</w:t></w:r><st1:place w:st="on"><st1:PlaceName w:st="on"><w:r>
<w:t>DEFENDANT</w:t></w:r></st1:PlaceName><w:r><w:t> </w:t></w:r><st1:PlaceType w:st="on"><w:r>
<w:t>STATE</w:t></w:r></st1:PlaceType></st1:place><w:r><w:t>] [DEFENDANT ZIP]</w:r><w:r>
這樣:
<w:p><w:r><w:t>[DEFENDANT CITY], [DEFENDANT STATE] [DEFENDANT ZIP]</w:r><w:r>
我一直與正則表達式epression像(\[)<.+>+([A-Z ]+\])
上regexPlanet全面測試無濟於事。
使用正則表達式解析XML非常困難和笨拙。是否有一個特別的原因,您不想使用適當的XML解析,如DOM/SAX? – Adrian
看看[這個答案](http://stackoverflow.com/a/1732454/2170192),它也與XML +正則表達式有關;)使用SAX解析器! –
您能保證XML全部在文本單行上嗎? –