我正在做一些網頁刮,我存儲的形式感興趣的變量:轉換列表快譯通對數據幀:熊貓
a = {'b':[100, 200],'c':[300, 400]}
這是一個頁面,其中有兩個b
「 s和兩個c
's。接下來的頁面可能有三個各自的,在那裏我會並將其作爲:
b = {'b':[300, 400, 500],'c':[500, 600, 700]}
當我去創建的dict
的列表中DataFrame
,我得到:
import pandas as pd
df = pd.DataFrame([a, b])
df
b c
0 [100, 200] [300, 400]
1 [300, 400, 500] [500, 600, 700]
什麼我期待的是:
df
b c
0 100 300
1 200 400
2 300 500
3 400 600
4 500 700
我可以創建一個DataFrame
每個I存儲網頁和concat
的DataFrame
「SA列表時間結束。然而,根據經驗,這是非常昂貴的,因爲構建成千上萬的DataFrame
比從較低級別的構造器(即,dict
的列表)創建一個DataFrame
要昂貴得多。
可能重複[此問題](http://stackoverflow.com/q/38577737/6525140)?不完全是這樣,但至少兩個問題彼此強烈相關。 – mhoff
對鍵進行迭代和合並列表看起來就像您想要的解決方案。 –
你需要'a'和'b'字典來做其他事情嗎?如果沒有,你可以在你從所有頁面接收到數據的時候繼續附加數據來代替'a',然後執行'df = pd.DataFrame(a)'。 –