我掙扎解析ATOM XML文件,從一個API來,到公共數據結構,如dict
,Pandas dataframe
或JSON
,的Python 3.X:解析ATOM XML並轉換爲字典
我明白XML文件比JSON文件更復雜,因此不會有一個非常簡單的通用解決方案。我希望,鑑於我處理ATOM結構的事實可能有助於將文件解析爲更一般的數據結構。
的XML數據的結構:http://opendata.cbs.nl/ODataFeed/OData/70266ned/TypedDataSet 而對於JSON這裏類似:http://opendata.cbs.nl/ODataFeed/OData/70266ned/TypedDataSet
我不能使用JSON文件的原因是,它常常是不可用的。
我打得四處像xml.etree
,xmltodict
,lxml
,xmljson
和feedparser
庫,但我不斷收到錯誤。
例如,使用feedparser
:
r = requests.get('http://opendata.cbs.nl/ODataFeed/OData/70266ned/TypedDataSet')
tree = ElementTree.fromstring(r.content)
息率
xml.etree.ElementTree.ParseError: not well-formated (invalid token): line 1, column 0
幫助將高度讚賞錯誤!