功能，其複製dplyr GROUP_BY（多變量）函數中的R

Python pandas equvilant to R groupby mutate

在dplyr：

df = df%>% group_by(a,b) %>%

意味着第一數據幀由a列分組然後通過b。

在我的情況下，我想首先按group_name列將我的數據分組，然後按user_name，然後按type_of_work。有三列以上（這就是爲什麼我感到困惑），但我需要按照這三個標題按照相同的順序分組數據。在這個階段之後，我已經有了一個算法來處理列。我只需要一個算法來創建根據這三列分組的數據幀。

在我的情況下，重要的是序列被保存爲dplyr函數。

我們有什麼類似的pandas數據框？

來源

2017-06-19 Binamrata Sharma

您是否閱讀過[docs]（http://pandas.pydata.org/pandas-docs/stable/groupby.html）？ – EdChum

試試df.groupby？ –

@EdChum我在使用groupby和apply方法時被卡住了，因爲顯然groupby不能輕鬆地分配給數據框。 –

分組= df.groupby（[「一」，「B」]）

瞭解更多關於「裂應用於-結合」策略，在大熊貓文檔，看看這些問題大熊貓如何處理相比於R 。

從您的評論看來，你似乎要分配分組幀。您可以通過API使用groupbyobject，例如grouped.mean（），也可以迭代groupby對象。您將在每個循環中獲得名稱和組。

來源

2017-06-19 09:43:11

功能，其複製dplyr GROUP_BY（多變量）函數中的R

回答

相關問題