我有熊貓數據框合併問題。熊貓合併多數據幀(涉及DataFrame)
PLZ,以下數據..
Rating csv
UserID ContentID Rating
U-1 C-1 3
U-1 C-2 4
U-3 C-3 1
U-5 C-1 5
Content csv
Title ContentID Language
T-1 C-1 EN
T-2 C-2 EN
T-3 C-3 EN
User csv
UserID Age Gender
U-1 10 1
U-2 20 0
U-3 30 1
U-4 40 0
U-5 50 1
U-6 60 0
U-7 70 1
我想結果
UserID ContentID Rating Title Language Age Gender
U-1 C-1 3 T-1 EN 10 1
U-1 C-2 4 T-2 EN 10 1
U-1 C-3 NAN T-3 EN 10 1
U-2 C-1 NAN T-1 EN 20 0
U-2 C-2 NAN T-2 EN 20 0
U-2 C-3 NAN T-3 EN 20 0
U-3 C-1 NAN T-1 EN 30 1
U-3 C-2 NAN T-2 EN 30 1
U-3 C-3 1 T-3 EN 30 1
U-4 C-1 NAN T-1 EN 40 0
U-4 C-2 NAN T-2 EN 40 0
U-4 C-3 NAN T-3 EN 40 0
U-5 C-1 5 T-1 EN 50 1
U-5 C-2 NAN T-2 EN 50 1
U-5 C-3 NAN T-3 EN 50 1
U-6 C-1 NAN T-1 EN 60 0
U-6 C-2 NAN T-2 EN 60 0
U-6 C-3 NAN T-3 EN 60 0
U-7 C-1 NAN T-1 EN 70 1
U-7 C-2 NAN T-2 EN 70 1
U-7 C-3 NAN T-3 EN 70 1
總DF行大小是用戶ID(用戶CSV)計數*內容識別(內容CSV)計數 (EX>以上7 * 3 - > 21行)
所有DataFrame都相關。換句話說,Result DataFrame僅僅是保留評級區域(NAN),其他區域是非南區域。其他區域是非南區域。
真實大小的內容(6000),用戶(220000) - >總結果行數:約13億
我嘗試它,但它是提高的MemoryError ...
PLZ,幫助me..Thanks ..
聽起來像是你想(的某些種類)的聯接。 –