2017-08-19 52 views
0

我在嘗試解析XML文件時遇到了垃圾錯誤。這是一個包含100個合併XML文件的文件,導致100個標籤。也意味着它不包含任何適當的根元素。所以我有兩個問題,我該如何閱讀文件,使其不會出錯?我該如何解決沒有根元素的問題?Python XML解析垃圾錯誤 - 多重編碼行

我一直在嘗試與它玩一段時間,但無濟於事,我試着一行一行閱讀,並轉換爲列表,但後來我不知道該怎麼辦呢.. ..

感謝

+1

你能提供[極小,完整,可驗證的示例](https://stackoverflow.com/help/mcve)你的問題? –

+0

1.將文件穿過檢查器以確保格式正確 2.手動清理文件,有時需要一點點的潤滑脂。如果沒有明確的模式,試圖以編程方式解決這個問題不會奏效 – diek

回答

0

問題:我怎麼讀取文件,使得它不會出錯?

在閱讀使用try: ... except:塊,例如:

try: 
    element = root.next_element() 
except Exception as exp: 
    print(exp) 

問題:我怎麼修復沒有根元素的問題?

添加<root>標籤包圍給XML表或部分:

xml = '<root>{}</root>'.format(xml)