dplyr

    33熱度

    1回答

    我試圖用dplyr替換我所有的plyr來電。仍然有一些障礙,其中一個與group_by函數。我想它的行爲與第二個參數ddply的行爲相同,並根據我列出的分組變量進行拆分,應用和合並。但似乎並非如此。這是一個相當微不足道的例子。 讓我們定義一個愚蠢的功能 mm <- function(x) return(x[1:5, ]) 現在我們可以在iris數據集拆分的品種,像這樣和這個功能適用於每件。 d

    54熱度

    4回答

    我想用dplyr在每個組中選擇一個最大值的行。 首先我產生一些隨機數據,以顯示我的問題 set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) 在plyr,我可以使用自定義功能選擇該行。 library(plyr) ddply(df, .(A, B), funct

    1熱度

    1回答

    我試圖將一些代碼從plyr移植到dplyr。 在一個特定的情況下,我得到2種欲組一起列組成:nameX和propX(參見下面的示例數據幀foo),與id柱沿。我使用ddply的結果給了我一個只有3列的數據幀,id,name和prop(見下面的數據幀bar)。 library(plyr) foo <- rbind( data.frame( id = 'A', name1

    3熱度

    1回答

    有沒有人知道dplyr方法對數據進行配對匹配,然後再進行算術運算?下面的for-loop重碼是基礎的MWE,但是我無法用dplyr的方法來解決問題(儘管出色的插圖和文檔)。 簡言之,代碼計算dev,這僅僅是在所有相鄰adj存儲有一週出售的非缺失量觀測q的平均值。 編輯:我感興趣的國家有不同的政策。讓下面的垂直線代表狀態邊界:縣1,2和3處於狀態A(帶有政策A),而縣4,5和6處於狀態B(帶有政策B

    0熱度

    1回答

    下列數據: require(dplyr) require(ggplot2) ds <- read.table(header = TRUE, text =" obs id year attend 1 47 2000 1 2 47 2001 3 3 47 2002 5 4 47 2003 8 5 47 20

    4熱度

    2回答

    這是this question的稍後續。我想使用dplyr函數而不是ddply來應用一個函數,該函數會生成幾個直接包含在結果中的行。我想這是在下面的例子中最好的解釋: library(plyr) #library(dplyr) dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex

    72熱度

    6回答

    假設我想計算每個組內不同值的比例。例如,使用所述數據mtcars,如何計算的齒輪通過上午(自動/手動)數的相對頻率一氣呵成與dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n

    13熱度

    2回答

    對於下面的數據 ds <- read.table(header = TRUE, text =" id year attend 1 2007 1 1 2008 1 1 2009 1 1 2010 1 1 2011 1 8 2007 3 8 2008 NA 8 2009 3 8 2010 NA 8 2011 3 9 2007 2 9 2008 3 9

    6熱度

    3回答

    現在,我有以下由original.df %.% group_by(Category) %.% tally() %.% arrange(desc(n))創建的data.frame。 DF <- structure(list(Category = c("E", "K", "M", "L", "I", "A", "S", "G", "N", "Q"), n = c(163051, 127133, 10

    1熱度

    3回答

    我有一個的大數據幀(DF),看起來像這樣: structure(list(var1 = c(1, 2, 3, 4, 2, 3, 4, 3, 2), var2 = c(2, 3, 4, 1, 2, 1, 1, 1, 3), var3 = c(4, 4, 2, 3, 3, 1, 1, 1, 4), var4 = c(2, 2, 2, 2, 3, 2, 3, 4, 1), var5 = c(