2
在熊貓中合併多個數據框(即多於2個)的最有效方式是什麼?有幾個答案:高效合併多個大熊貓數據框
- pandas joining multiple dataframes on columns
- Pandas left outer join multiple dataframes on multiple columns
但這些都涉及多種連接。如果我有N個數據幀,則需要N-1個連接。
如果我不使用熊貓,另一種解決方案是將所有內容都放入基於公共索引作爲鍵的哈希表中,然後構建最終版本。這基本上就像我相信SQL中的散列連接。熊貓裏有這樣的東西嗎?
如果不是,只用公共索引創建一個新的數據幀並將每個數據幀的原始數據傳遞給它會更有效嗎?看起來這樣至少會阻止你在每個N-1連接中創建一個新的數據幀。
謝謝。
你怎麼加入他們的行列?在索引?內部連接還是左邊/外部連接? – MaxU