2017-09-26 32 views
0

我期待加入2個數據框。左是歷史庫,右是當前數據以及歷史上可能更新的內容。熊貓加入數據框與更新功能

我想基於匹配2列加入(叫他們requestordate。)

所以,我想保留在存儲庫中的所有項目,如果有基於2列的新數據的匹配我想用新數據更新該行的其餘部分。

實質上,這是一個外連接,它在兩列上鍵值,如果有匹配,則用新數據覆蓋。

關於正確做法的任何想法?

編輯:

history = pd.concat([history,new])                  
mostrecentupdate = history.groupby(['Requestor','RequestDate'])['LastUpdateDate'].transform(max)   
history = history[history['LastUpdateDate'] == mostrecentupdate]    

回答