2012-05-27 41 views
0

我有兩個pandasDataFrame S和我想加入他們在一起,我得到的外連接去掉重複的。我的問題是.drop_duplicates()發現重複項時會忽略索引。如果索引不同,那麼它不應該是重複的。如果行索引和列重複,我該如何刪除重複項?我能想到的唯一的事情就是使用df.to_dict(),然後創建一個新的DataFrame(非常低效)。從指數數據框中刪除重複+排匹配

更新:

如這裏要求是我的數據的一個例子:

from pandas import * 
index1 = ['2012-05-2' + str(i) for i in range(0,6)] 
data1 = {'rate': range(0,6)} 
a = DataFrame(data1, index1) 

index2 = ['2012-05-2' + str(i) for i in range(3,9)] 
data2 = {'rate': range(3,9)} 
b = DataFrame(data2, index2) 

格倫

+1

如果有'a.combine_first(B)'是你想要的,你檢查?否則,你可以舉一個你的數據的例子,你期望/希望得到的結果是什麼? –

+0

您是否嘗試過使用'pandas.merge(A,B,method =「outer」)'? – lbolla

回答

1

解決方案:

a.combine_first(b) 

感謝韋斯。