2013-07-31 38 views
-1

我正在解析一個XML文件,它在某些標記之間有我不想解析的文本,甚至可能有破碎的標記。如何選擇不使用可用的模塊來分析Perl的xml解析文本?如何在Perl中解析xml時忽略某些標記?

在此先感謝。

+0

對不起,我是那種在一個Perl的新手,我想XML ::簡單,當我這樣做XMLin這使我的錯誤(「file.xml」)的「打開和結束標籤不匹配「,這是指特定標籤對內的標籤。這是我得到的唯一代碼。 – dasen

+0

請勿使用XML :: Simple或任何XML解析器,因爲它們都需要有效的xml。如果HTML是你使用HTML解析器的話。 – Himanshu

回答

4

如果XML已損壞(即格式不正確),那麼您將無法使用XML解析器。這是一個功能。所以你需要先解決它。

如果XML格式正確,則可以使用XML::Twigignore_elts選項。您會看到XML,就好像被忽略的元素永遠不會存在一樣。

另外,如果XML是「不是太破碎」,您可以嘗試XML::Liberal,它可能會處理它。或者不是...

如果您擁有的是XHTML或HTML或其他東西,則可以使用XML :: LibXML或XML :: Twig和相應的解析方法。

好運...

相關問題