0
我有2個數據框,我想要得到df,第一個文件中的第一個文件中有很多數據,第二個文件中有我想要的iD
的列表第一個文件。如何使用熊貓合併來自不同df的數據
我用
merged = pd.merge(buys, chunk, left_on='id', right_on='ID')
其中chunk
- 第一(大)文件的一部分。和buys
- 文件列表id
。在輸出文件中,我有ID
,那不在buys
。 我做錯了什麼?
buys
:
id
7602962fb83ac2e2a0cb44158ca88464
bc8a731e4c7e6f6b96e56ebe7f766bcd
a703114aa8a03495c3e042647212fa63
77138e9245857e5449e9474293e31e19
chunk
:
id date
7602962fb83ac2e2a0cb44158ca88464 01.01.2016
7602962fb83ac2e2a0cb44158ca88464 02.01.2016
7602962fb83ac2e2a0cb44158ca88464 03.01.2016
77138e9245857e5449e9474293e31e19 09.05.2016
77138e9245857e5449e9474293e31e19 10.05.2016
671cfd6702c74f017209c2f1a888c279 10.01.2016
671cfd6702c74f017209c2f1a888c279 11.01.2016
029cfd6702c68f243423c2f1a234c232 11.03.2016
,我需要得到
7602962fb83ac2e2a0cb44158ca88464 01.01.2016
7602962fb83ac2e2a0cb44158ca88464 02.01.2016
7602962fb83ac2e2a0cb44158ca88464 03.01.2016
77138e9245857e5449e9474293e31e19 09.05.2016
77138e9245857e5449e9474293e31e19 10.05.2016
你可以發佈樣本數據和期望的輸出嗎? –
@JoeR,添加數據幀 – ldevyataykina
將'how = left'添加到'pd.merge'。 – ytk