2013-04-04 102 views
-1

我在XML文件的內容:如何刪除文本內容中的固定XML標籤?

Hello 
<Images> 
<URL>google</URL> 
</Images> 
<Reviews> 
Good 
</Reviews> 
everybody, 

<Images> 
<URL>bing</URL> 
</Images> 
<Reviews> 
Good 
</Reviews> 
I am Nguyen 

輸出:

Hello everybody, I am Nguyen 

如何刪除<Images></Reviews>之間的內容。

上面的示例數據很小。其實,我有一個大數據。

+0

正如前面所說[在此之前](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454),您應該_not_嘗試使用正則表達式解析XML或HTML。你會慘敗的。相反,使用XML解析器。 – 2013-04-04 16:09:51

+0

@RobI你說錯了,不是'你會失敗',而是'你可能會失敗';)如果內容足夠靜態,你可以使用正則表達式。我曾經在一些數據文件中做過。但是,當然你必須確定你正在使用的內容。 – 2013-04-04 16:11:31

回答

1

您可以用一個空格替換(?:\s*<(Images|Reviews)>.+?</\1>\s*)+。如果您使用的正則表達式不支持點全部(代表全部個字符的點(包括換行符)),則必須使其更復雜一點:​​適用於JavaScript。

+0

非常感謝!太好了!有用 ! :d – 2013-04-05 01:07:06

相關問題