0
我期待加入2個數據框。左是歷史庫,右是當前數據以及歷史上可能更新的內容。熊貓加入數據框與更新功能
我想基於匹配2列加入(叫他們requestor
和date
。)
所以,我想保留在存儲庫中的所有項目,如果有基於2列的新數據的匹配我想用新數據更新該行的其餘部分。
實質上,這是一個外連接,它在兩列上鍵值,如果有匹配,則用新數據覆蓋。
關於正確做法的任何想法?
編輯:
history = pd.concat([history,new])
mostrecentupdate = history.groupby(['Requestor','RequestDate'])['LastUpdateDate'].transform(max)
history = history[history['LastUpdateDate'] == mostrecentupdate]
感謝您的見解。經過一番研究,我相信我找到了解決方案,可以解決我編輯我的問題。 – pacificdune