從指數數據框中刪除重複+排匹配

我有兩個pandasDataFrame S和我想加入他們在一起，我得到的外連接去掉重複的。我的問題是.drop_duplicates()發現重複項時會忽略索引。如果索引不同，那麼它不應該是重複的。如果行索引和列重複，我該如何刪除重複項？我能想到的唯一的事情就是使用df.to_dict()，然後創建一個新的DataFrame（非常低效）。從指數數據框中刪除重複+排匹配

更新：

如這裏要求是我的數據的一個例子：

from pandas import * 
index1 = ['2012-05-2' + str(i) for i in range(0,6)] 
data1 = {'rate': range(0,6)} 
a = DataFrame(data1, index1) 

index2 = ['2012-05-2' + str(i) for i in range(3,9)] 
data2 = {'rate': range(3,9)} 
b = DataFrame(data2, index2)

格倫

來源

2012-05-27 dailyglen

如果有'a.combine_first（B）'是你想要的，你檢查？否則，你可以舉一個你的數據的例子，你期望/希望得到的結果是什麼？ –

您是否嘗試過使用'pandas.merge（A，B，method =「outer」）'？ – lbolla

解決方案：

a.combine_first(b)

感謝韋斯。

來源

2012-05-29 04:43:14 dailyglen

從指數數據框中刪除重複+排匹配

回答

相關問題