dplyr

33熱度

1回答

我試圖用dplyr替換我所有的plyr來電。仍然有一些障礙，其中一個與group_by函數。我想它的行爲與第二個參數ddply的行爲相同，並根據我列出的分組變量進行拆分，應用和合並。但似乎並非如此。這是一個相當微不足道的例子。讓我們定義一個愚蠢的功能 mm <- function(x) return(x[1:5, ]) 現在我們可以在iris數據集拆分的品種，像這樣和這個功能適用於每件。 d

54熱度

4回答

如何用dplyr選擇每個組中具有最大值的行？

我想用dplyr在每個組中選擇一個最大值的行。首先我產生一些隨機數據，以顯示我的問題 set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) 在plyr，我可以使用自定義功能選擇該行。 library(plyr) ddply(df, .(A, B), funct

1熱度

1回答

使用dplyr和tidyr並行合併兩種類型的列

我試圖將一些代碼從plyr移植到dplyr。在一個特定的情況下，我得到2種欲組一起列組成：nameX和propX（參見下面的示例數據幀foo），與id柱沿。我使用ddply的結果給了我一個只有3列的數據幀，id,name和prop（見下面的數據幀bar）。 library(plyr) foo <- rbind( data.frame( id = 'A', name1

3熱度

1回答

如何使用dplyr消除循環？

有沒有人知道dplyr方法對數據進行配對匹配，然後再進行算術運算？下面的for-loop重碼是基礎的MWE，但是我無法用dplyr的方法來解決問題（儘管出色的插圖和文檔）。簡言之，代碼計算dev，這僅僅是在所有相鄰adj存儲有一週出售的非缺失量觀測q的平均值。編輯：我感興趣的國家有不同的政策。讓下面的垂直線代表狀態邊界：縣1,2和3處於狀態A（帶有政策A），而縣4,5和6處於狀態B（帶有政策B

0熱度

1回答

相同的二次和三次預測

下列數據： require(dplyr) require(ggplot2) ds <- read.table(header = TRUE, text =" obs id year attend 1 47 2000 1 2 47 2001 3 3 47 2002 5 4 47 2003 8 5 47 20

4熱度

2回答

ddply - > dplyr：.fun =總結了幾行

這是this question的稍後續。我想使用dplyr函數而不是ddply來應用一個函數，該函數會生成幾個直接包含在結果中的行。我想這是在下面的例子中最好的解釋： library(plyr) #library(dplyr) dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex

72熱度

6回答

相對頻率/與dplyr的比例

假設我想計算每個組內不同值的比例。例如，使用所述數據mtcars，如何計算的齒輪通過上午（自動/手動）數的相對頻率一氣呵成與dplyr？ library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n

13熱度

2回答

如何刪除觀察組，dplyr ::過濾器（）

對於下面的數據 ds <- read.table(header = TRUE, text =" id year attend 1 2007 1 1 2008 1 1 2009 1 1 2010 1 1 2011 1 8 2007 3 8 2008 NA 8 2009 3 8 2010 NA 8 2011 3 9 2007 2 9 2008 3 9

6熱度

3回答

創建「其他」字段

現在，我有以下由original.df %.% group_by(Category) %.% tally() %.% arrange(desc(n))創建的data.frame。 DF <- structure(list(Category = c("E", "K", "M", "L", "I", "A", "S", "G", "N", "Q"), n = c(163051, 127133, 10

1熱度

3回答

將rowwise計數的值發生爲新變量，如何在R中使用dplyr來做到這一點？

我有一個的大數據幀（DF），看起來像這樣： structure(list(var1 = c(1, 2, 3, 4, 2, 3, 4, 3, 2), var2 = c(2, 3, 4, 1, 2, 1, 1, 1, 3), var3 = c(4, 4, 2, 3, 3, 1, 1, 1, 4), var4 = c(2, 2, 2, 2, 3, 2, 3, 4, 1), var5 = c(