2010-11-05 47 views
0

我正在使用NSXMLParser解析XML文件。並且有一個完整的部分,最終打破瞭解析過程。基本上它有一點HTML,它們從未包裝在CDATA中。在解析之前刪除XML文件中的內容

無論如何,我可以通過解析器發送它之前刪除它,所以它不會中斷。 (在此位的信息並不重要,並且可以扔掉)

的XML一種看起來像這樣

<foo> 
    text</span></li><li> 
    <span class="ft">Not important:</span> 
    <span class="fc"><a href="Some random link">0</a> 
</foo> 

正如你所看到的跨度標記都搞砸了。如何才能完全擺脫foo的內容。

回答

0

您可以先在數據上運行HTML tidy - 這將提供有效的XML。你可以在配置文件中添加非html標籤

+0

我只是想把部分去掉。我不想嘗試修復它。 – endy 2010-11-05 21:54:12

+0

麻煩的是,刪除foo - 通常的方式是使用正則表達式,但在xml上使用正則表達式並不行 - 所以我認爲修復xml然後刪除foo是最簡單的方法 - 除非只有一個foo元素,並且您總是想要刪除它 – Mark 2010-11-06 11:08:36

相關問題