2012-06-08 80 views
5

我有成千上萬行的XML文件,如:XML到大熊貓數據幀

<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word> 

我想它(所有它的屬性)轉換爲pandasdataframe。要做到這一點,我可以循環使用美麗的湯文件,並逐行插入值或創建列表插入爲列。不過,我想知道是否有更多pythonic完成我所描述的方式。先謝謝你。

代碼示例:

x1list=[] 
x2list=[] 

for word in soup.page.findAll('word'): 
    x1list.append(int(word['x1'])) 
    x2list.append(int(word['x2'])) 
df=DataFrame({'x1':x1list,'x2':x2list}) 
+0

我們展示你的代碼。 – eumiro

+0

@eumiro:添加了一個代碼示例... – root

回答

3

試試這個:

DataFrame.from_records([(int(word['x1']), int(word['x2'])) 
         for word in soup.page.findAll('word')], 
         columns=('x1', 'x2')) 
+0

謝謝。我會試一試。 – root