忽略XML標記之間的文本

""" test.xml 

<xyz> 
     <pqr> 
     <abc><a href="data:text/html;charset=utf-8,base64,JTNjc2NyaXB0JTNlYWxlcnQoIlhTUyIpO2hpc3RvcnkuYmFjaygpOyUzYy9zY3JpcHQlM2UiPjwvYT4=</abc> 
     </pqr> 
     <pqr> 
     <abc><iframe src="data:text/html;charset=utf-8,base64,JTNjc2NyaXB0JTNlYWxlcnQoIlhTUyIpO2hpc3RvcnkuYmFjaygpOyUzYy9zY3JpcHQlM2UiPjwv</abc> 
     </pqr> 
<xyz> 

""""

當我使用這個XML文件並在python中解析時，它顯示錯誤（不正確）。我怎樣才能解析這個XML文件或任何其他方法從這個文件中獲取數據。忽略XML標記之間的文本

來源

2011-04-20 Arjun Jain

您應該在每行之前放置四個空格來格式化代碼。您也可以選擇它並單擊「{}」按鈕。在[Markdown編輯幫助]（http://stackoverflow.com/editing-help）頁面提供更多有用的提示。 – 2011-04-20 09:36:50

您可以先修改XML和使用CDATA來封裝格式不正確的XML

例如：

<xyz> 
     <pqr> 
     <abc><![CDATA[<a href="data:text/html;charset=utf-8,base64,JTNjc2NyaXB0JTNlYWxlcnQoIlhTUyIpO2hpc3RvcnkuYmFjaygpOyUzYy9zY3JpcHQlM2UiPjwvYT4=]]></abc> 
     </pqr> 
     <pqr> 
     <abc><![CDATA[<iframe src="data:text/html;charset=utf-8,base64,JTNjc2NyaXB0JTNlYWxlcnQoIlhTUyIpO2hpc3RvcnkuYmFjaygpOyUzYy9zY3JpcHQlM2UiPjwv]]></abc> 
     </pqr> 
<xyz>

見：http://www.w3schools.com/xml/xml_cdata.asp

這個你可以使用Python中的XML解析器

後

來源

2011-04-20 09:39:42

現在它的作品謝謝szymon – 2011-04-20 09:50:48