可能重複:
Using C# regular expressions to remove HTML tags正則表達式 - 刪除標記
我不得不刪除標記,並保持在一個XML文件中的所有其他信息。使用正則表達式時,我有點不知所措。我只能想出一行一行的讀取文件,然後嘗試「定位」所有標籤,並用「」 - 空字符串替換它們。但是,它不按預期工作:
line = Regex.Replace(line, "<.*>", "");
我能請得到一個解釋這是爲什麼不按預期工作(我認爲這應該只是找到其內部<>另外,可以符號的所有可能的組合。你應該推薦一個很好的正則表達式的介紹,我在regular-expressions.info上看了很多,但是我發現它在某種程度上是不完整和令人困惑的。
爲什麼不使用xml解析器? – I4V
你究竟想要留下什麼?除了'<' and '>'以外的所有東西?留下屬性?留下CDATA和XText? – user7116
從XML文件中刪除'<>'?有些事情告訴我你並沒有採用最佳方法。 –