1
考慮這種情況:功能,其複製dplyr GROUP_BY(多變量)函數中的R
Python pandas equvilant to R groupby mutate
在dplyr
:
df = df%>% group_by(a,b) %>%
意味着第一數據幀由a
列分組然後通過b
。
在我的情況下,我想首先按group_name
列將我的數據分組,然後按user_name
,然後按type_of_work
。有三列以上(這就是爲什麼我感到困惑),但我需要按照這三個標題按照相同的順序分組數據。在這個階段之後,我已經有了一個算法來處理列。我只需要一個算法來創建根據這三列分組的數據幀。
在我的情況下,重要的是序列被保存爲dplyr
函數。
我們有什麼類似的pandas
數據框?
您是否閱讀過[docs](http://pandas.pydata.org/pandas-docs/stable/groupby.html)? – EdChum
試試df.groupby? –
@EdChum我在使用groupby和apply方法時被卡住了,因爲顯然groupby不能輕鬆地分配給數據框。 –