假設我有兩個熊貓DataFrames:df1
,這是大小5 x K
和df2
是大小3 x K
的,
| key | rest ... | key | rest ...
---------------- ----------------
| A1 | ⋮ | A1 | ⋮
| A2 | ⋮ | A3 | ⋮
| A3 | ⋮ | A4 | ⋮
| A4 | ⋮
| A5 | ⋮
在我的實際數據集中,key
包含名稱(例如,不是A2
),半重疊不遵循任何模式。
問題
我想加入df1
和df2
在A1
,A3
和A5
的key
柱,其 '半重疊'。
計劃
我想我可以空行df2
,例如添加兩個空行df2
的值爲A2
和A5
爲key
,然後加入DataFrame。但是,那麼我需要找出哪些行在df2
中缺失。
也許我可以構造一個for
循環在鍵上,當沒有鍵匹配時它會創建一個空行,對於key
缺少An
?我不知道如何構建兩個數據框的for循環。
也許有一個整齊的命令一次加入框架,填補空行?
編輯:剛纔意識到它可能是兩種方式,即df2
中有鍵不在df1
。但我想運行一個循環,首先檢查從df1
到df2
的密鑰,然後檢查從df2
到df1
的密鑰應該工作。
聽起來像是你想要一個外連接。查看關於[合併,連接和連接]的Pandas文檔(http://pandas.pydata.org/pandas-docs/stable/merging.html)。 –