0
我有兩個pandas
DataFrame
S和我想加入他們在一起,我得到的外連接去掉重複的。我的問題是.drop_duplicates()
發現重複項時會忽略索引。如果索引不同,那麼它不應該是重複的。如果行索引和列重複,我該如何刪除重複項?我能想到的唯一的事情就是使用df.to_dict()
,然後創建一個新的DataFrame(非常低效)。從指數數據框中刪除重複+排匹配
更新:
如這裏要求是我的數據的一個例子:
from pandas import *
index1 = ['2012-05-2' + str(i) for i in range(0,6)]
data1 = {'rate': range(0,6)}
a = DataFrame(data1, index1)
index2 = ['2012-05-2' + str(i) for i in range(3,9)]
data2 = {'rate': range(3,9)}
b = DataFrame(data2, index2)
格倫
如果有'a.combine_first(B)'是你想要的,你檢查?否則,你可以舉一個你的數據的例子,你期望/希望得到的結果是什麼? –
您是否嘗試過使用'pandas.merge(A,B,method =「outer」)'? – lbolla