5
我有成千上萬行的XML文件,如:XML到大熊貓數據幀
<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>
我想它(所有它的屬性)轉換爲pandas
dataframe
。要做到這一點,我可以循環使用美麗的湯文件,並逐行插入值或創建列表插入爲列。不過,我想知道是否有更多pythonic完成我所描述的方式。先謝謝你。
代碼示例:
x1list=[]
x2list=[]
for word in soup.page.findAll('word'):
x1list.append(int(word['x1']))
x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})
我們展示你的代碼。 – eumiro
@eumiro:添加了一個代碼示例... – root