2010-01-21 55 views
3

如何使用Python ElementTree讀取XML文件(如果XML有多個頂級項目)?使用Python ElementTree讀取多個頂級項目的XML?

我有一個XML文件,我想閱讀使用Python ElementTree。

不幸的是,它有多個頂級標籤。我會圍繞XML包裝<doc>...</doc>,除了我必須在,<?xml><!DOCTYPE>字段之後放置<doc>。但是搞清楚<!DOCTYPE>結尾是不是平凡的。

我有什麼:

<?xml version="1.0" encoding="UTF-8"?> 
<!DOCTYPE FOO BAR "foo.dtd" [ 
<!ENTITY ...> 
<!ENTITY ...> 
<!ENTITY ...> 
]> 
<ARTICLE> ... </ARTICLE> 
<ARTICLE> ... </ARTICLE> 
<ARTICLE> ... </ARTICLE> 
<ARTICLE> ... </ARTICLE> 

我想要什麼:

<?xml version="1.0" encoding="UTF-8"?> 
<!DOCTYPE FOO BAR "foo.dtd" [ 
<!ENTITY ...> 
<!ENTITY ...> 
<!ENTITY ...> 
]> 
<DOC> 
<ARTICLE> ... </ARTICLE> 
<ARTICLE> ... </ARTICLE> 
<ARTICLE> ... </ARTICLE> 
<ARTICLE> ... </ARTICLE> 
</DOC> 

NB標籤物品的名稱可能會改變,所以我不能用grep它。

任何人都可以向我推薦如何在XML標頭後添加封閉的<doc>...</doc>,或者提出其他解決方法?

回答