我有不同的尺寸就這樣兩個不同的數據幀:合併,總和和刪除重複與熊貓
df_web = (['Event Category', 'ID', 'Total Events',
'Unique Events', 'Event Value', 'Avg. Value'])
df_app = (['Event Category', 'ID', 'Total Events',
'Unique Events', 'Event Value', 'Avg. Value']
我用熊貓嘗試在「df_final」合併它們,但我想總結具有相同'ID'的'Total Events'的值,最後我希望在ID中有一個沒有重複的'df_final'。
我想:
df_final_analysis = df_web.groupby(['Event Category', 'ID', 'Total Events',
'Unique Events', 'Event Value', 'Avg. Value'],
as_index=False)['Total Events'].sum()
但它不給我我想要的結果。
例如:
df_web
Video A 10
Video B 5
Video C 1
Video F 1
Video G 1
Video H 1
對於df_app:
Video A 15
Video D 3
Video C 1
因爲我想df_final_analysis:
Video A 25
Video B 5
Video D 3
Video C 2
Video F 1
Video G 1
Video H 1
是否有一個優雅的方式來做到這一點?從使用pd.concat代碼
請提供[MCVE]。 – IanS
我試圖用一個例子來改進問題。謝謝。 – Thabra
@Thabra真的 - 'df_ *'變量根本不是數據框,而是列表;第二個甚至沒有正確分隔。 –