我有一個創建在XML記錄是這樣的一個bazillion記錄XML文件中的一些硬件:在一段時間使用Python來驗證XML數字字符串
<Reading>
<DeviceId>13553678</DeviceId>
<Reading>1009735</Reading>
<DataStatus>0</DataStatus>
</Reading>
每一次,我們將體驗到硬件故障,其中一個字符值被插入到閱讀標籤,就像這樣:
<Reading>
<DeviceId>13553678</DeviceId>
<Reading>100F735</Reading>
<DataStatus>0</DataStatus>
</Reading>
不幸的是,消耗這個XML文件將轉儲整個文件與應用「輸入字符串的不正確的格式」的錯誤。我想用Python編寫一箇中介程序,以從xml文件中刪除不良記錄,將它們歸檔,然後重建文件進行處理。我使用python進行簡單的文本處理,但我相信我可以利用一些XML功能。任何幫助,將不勝感激。
嘗試lxml模塊和SAX解析器[SAX](http://lxml.de/sax.html)。 – Keith