我有一個數據幀DF,有兩列,我想GROUPBY一列,並加入列表屬於同一組,例如:大熊貓GROUPBY和連接列出
column_a, column_b
1, [1,2,3]
1, [2,5]
2, [5,6]
過程後:
column_a, column_b
1, [1,2,3,2,5]
2, [5,6]
我想保留所有重複項。我有以下問題:
- dataframe的dtypes是對象。 convert_objects()不會自動將column_b轉換爲列表。我怎樣才能做到這一點?
- df.groupby(...)。apply(lambda x:...)中的函數應用於? x的形式是什麼?清單?
- 解決我的主要問題?
在此先感謝。
謝謝,我還有一個問題:如果我有第三列是字符串類型,並且我想按列的組加上它們。我該怎麼辦? –
字符串就像字符列表。所以'.sum()'也應該在那裏工作。 – TomAugspurger
是的,但我想在每個連接的字符串之間有一個''(空格)。 –