我想解析在xml.etree.ElementTree模塊中使用iterparse的Medline xml文檔。除了一些文本包含非ascii字符之外,所有操作都很好。我沒有看到使用findtext處理unicode的方法。有什麼建議麼?xml.etree.ElementTree和unicode findtext
2
A
回答
2
你有沒有試着用UTF8編碼FLAH打開文件:
fd = open('some.xml', mode='r', encoding='utf-8')
xml.etree.ElementTree.iterparse(fd)
或者使用解碼:
fd = open('some.xml', mode='r')
sio = StringIO(fd.read().decode("utf-8"))
xml.etree.ElementTree.iterparse(sio)
0
這是除了上面的回答一個非常有用的帖子。
相關問題
- 1. py2app和xml.etree.ElementTree
- 2. xml.etree.ElementTree for chinese
- 3. XML使用xml.etree.ElementTree
- 4. 什麼的findall之間)和iterfind)xml.etree.ElementTree
- 5. Acobat X1 FindText然後GetPageNum
- 6. Python import xml不包含xml.etree.ElementTree
- 7. IronPython - MissingMemberException試圖導入xml.etree.ElementTree
- 8. 測試xml.etree.ElementTree的等價性
- 9. xml.etree.ElementTree變量搜索標記
- 10. 使用xml.etree.ElementTree解析XHTML
- 11. 使用xml.etree.ElementTree解析XML
- 12. Python的xml.etree.ElementTree目錄接取
- 13. ElementTree findtext找不到葉節點
- 14. 應用程序腳本文檔的findText
- 15. Google Apps腳本findtext searchpattern格式?
- 16. 方法findText與正則表達式
- 17. findText找到包含引用的內容
- 18. QComboBox FINDTEXT無法找到的QString
- 19. 使用xml.etree.elementtree解析XML數據,然後求和
- 20. 模塊xml.etree.ElementTree和xml是如何關聯的?
- 21. Python re.sub()和unicode
- 22. python和unicode stderr
- 23. Unicode和性能
- 24. Selenium webdriver和unicode
- 25. django:tinymce和unicode
- 26. BlueCloth 2和unicode
- 27. python urllib2和unicode
- 28. wWinmain,Unicode和Mingw
- 29. Java和unicode
- 30. Unicode和Android NDK
我認爲這應該工作,但我仍然得到錯誤。下一步是驗證編碼是否確實是UTF-8 – seandavi
第二個解決方案可以正常工作 –