2017-06-19 73 views
1

考慮這種情況:功能,其複製dplyr GROUP_BY(多變量)函數中的R

Python pandas equvilant to R groupby mutate

dplyr

df = df%>% group_by(a,b) %>% 

意味着第一數據幀由a列分組然後通過b

在我的情況下,我想首先按group_name列將我的數據分組,然後按user_name,然後按type_of_work。有三列以上(這就是爲什麼我感到困惑),但我需要按照這三個標題按照相同的順序分組數據。在這個階段之後,我已經有了一個算法來處理列。我只需要一個算法來創建根據這三列分組的數據幀。

在我的情況下,重要的是序列被保存爲dplyr函數。

我們有什麼類似的pandas數據框?

+0

您是否閱讀過[docs](http://pandas.pydata.org/pandas-docs/stable/groupby.html)? – EdChum

+0

試試df.groupby? –

+0

@EdChum我在使用groupby和apply方法時被卡住了,因爲顯然groupby不能輕鬆地分配給數據框。 –

回答

0

分組= df.groupby([「一」,「B」])

瞭解更多關於「裂應用於-結合」策略,在大熊貓文檔,看看這些問題大熊貓如何處理相比於R 。

從您的評論看來,你似乎要分配分組幀。您可以通過API使用groupbyobject,例如grouped.mean(),也可以迭代groupby對象。您將在每個循環中獲得名稱和組。