1
我需要從XML文件中提取某些數據,但也知道提取的元素在原始XML文件中的位置 - 作爲從文件開始的字符偏移量,或該行中的行號+位置。python中的XML解析,同時保留鏈接到原始文件中的位置
常用的python XML庫似乎沒有提供任何這樣的功能。
有一個類似的問題Obtaining position info when parsing HTML in Python這是通過編寫一個自定義的包裝器解決html5lib;但該庫不適用於我,因爲特定的數據不是HTML。
是否有任何保存元素位置信息的XML解析器,還是我必須爲此自動解析?
lxml有'sourceline',但只給你行號 – gsnedders