嘗試將根標記添加到2mil行XML文件的開頭和結尾,以便可以使用我的Python代碼正確處理該文件。將<root>標記添加到使用Python的XML文檔
我嘗試使用此代碼從previous post,但我得到一個錯誤「XMLSyntaxError:在文檔,行__年底額外的內容,第1列」
如何解決這個問題?或者,有沒有更好的方法在我的大型XML文檔的開始和結尾添加根標籤?
import lxml.etree as ET
tree = ET.parse('test.xml')
root = tree.getroot()
newroot = ET.Element("root")
newroot.insert(0, root)
print(ET.tostring(newroot, pretty_print=True))
我的測試XML
<pub>
<ID>75</ID>
<title>Use of Lexicon Density in Evaluating Word Recognizers</title>
<year>2000</year>
<booktitle>Multiple Classifier Systems</booktitle>
<pages>310-319</pages>
<authors>
<author>Petr Slavík</author>
<author>Venu Govindaraju</author>
</authors>
</pub>
<pub>
<ID>120</ID>
<title>Virtual endoscopy with force feedback - a new system for neurosurgical training</title>
<year>2003</year>
<booktitle>CARS</booktitle>
<pages>782-787</pages>
<authors>
<author>Christos Trantakis</author>
<author>Friedrich Bootz</author>
<author>Gero Strauß</author>
<author>Edgar Nowatius</author>
<author>Dirk Lindner</author>
<author>Hüseyin Kemâl Çakmak</author>
<author>Heiko Maaß</author>
<author>Uwe G. Kühnapfel</author>
<author>Jürgen Meixensberger</author>
</authors>
</pub>
你的test.xml文件沒有根元素,所以它不是真正的XML,也不能被解析。 – mzjn
@mzjn你錯過了這一點,我試圖添加根標籤,以便它可以被讀爲XML。 – douglasrcjames
那麼,我的意思是,你試圖在添加根元素之前將test.xml解析爲XML。這就是你得到錯誤的原因。 – mzjn