2010-02-07 47 views
1

我是xml新手。我試圖解析XML文件來提取數據,但它表明下面當我打電話doc=minidom.parse('D:\\CONFIGRATION.xml')消息的錯誤...python xml錯誤

xml.parsers.expat.ExpatError:not well-formed (invalid token): line 474, column 15 

473 <Extras> 
474 <extra Type> 
475  jpg 
476 </extra Type> 
477 <extra Type> 
478  psd 
479 </extra Type> 
480 </Extras> 

任何人都可以幫我嗎?什麼是格式良好的XML文檔?

在此先感謝

+1

爲什麼不貼出來CONFIGATION.xml的內容? – 2010-02-07 14:56:02

+0

是的,人給我們展示了一些xml人! – 2010-02-07 14:57:07

+1

我不確定我想在這裏看到474行XML。 – JasonSmith 2010-02-07 14:57:31

回答

2

你問什麼是「結構良好」的意思。這意味着XML符合標準。不是「格式良好」意味着你使用了非法語法。在你的具體情況下,你有一個標籤,如下所示:

<@extra Type> 

您的標籤名稱中不能有空格。你還有其他問題 - 你不能用@開始標籤,而你的結束標籤也是錯誤的。斜線需要緊跟<

格式良好的XML的官方規範在W3C website上。您的xml違反規範。如果您想了解關於您的文檔的更多詳細信息,您可以使用許多xml驗證服務之一。使用您最喜愛的搜索引擎搜索「xml驗證」。

+0

+1這就是我正在尋找的 – 2010-02-08 09:10:07

+0

還有一件事(即@顯示這個頁面中的標籤)我沒有把@放在我的代碼中 – 2010-02-08 09:11:06

0

檢查,看看你的文件有474行,15列的錯誤有可能是一個線索或接近該點。

另外,你拼錯配置?你錯過了'U'。

+0

因爲它正確讀取文件,所以他可能沒有拼錯它(在沒有指定有效文件的意義上)。 – 2010-02-07 14:58:22

+0

不管怎樣,(形成良好的文件)是什麼意思?這是否意味着。我沒有封閉標籤? 我檢查了它。我想這很好。 – 2010-02-07 15:35:56

+0

@John,是的,我只是想提醒他,除了這個bug之外,他的配置文件拼錯了。 – JasonSmith 2010-02-08 03:46:23

2

「格式良好的XML」是指文檔符合the W3C standards。錯誤消息意味着您的文檔由於某種原因不符合這些標準。例如,那些<EXTRA TYPE>標籤是非法的,因爲它們包含空格。

閱讀這樣一個在Developer.com的概述。