plyr

1熱度

2回答

我有一個小麻煩創建使用ineq（）庫，計算基尼係數中的命令一個新的變量。我給ineq命令的向量是我感興趣的列的列表。我想爲每個單獨的行運行此命令，然後追加新的變量。當我嘗試這是一個循環或使用ddply（這我剛纔學習），輸出是一樣的基尼得分（整個數據集）的每一行。我怎樣才能運行此命令爲每個行？提前致謝！ library(ineq) df <- data.frame(user = 1:5, v1

17熱度

5回答

將聚合值加回到原始數據框

我反覆使用的設計模式之一是在數據框上執行「group by」或「split，apply，combine（SAC）」，然後加入聚合數據回到原始數據。例如，在計算每個縣與許多州和縣的數據框中的州平均數偏差時，這很有用。我的總計算很少是一個簡單的意思，但它是一個很好的例子。我經常解決這一問題的方式如下： require(plyr) set.seed(1) ## set up some data

0熱度

2回答

plyr應用程序，創建每個對應於數據子集的矩陣列表

通過一些幫助，我想出瞭如何將edgelist，aka，adjacency list轉換爲adjacency matrix.我想了解如何自動執行此操作大量邊界列表，然後將得到的鄰接矩陣放入列表中。我猜plyr是做這件事的最好方法，但是如果你想告訴我如何用循環做到這一點，我會很感激。好奇的是，這些數據代表了不同學校的社交網絡。這裏是我到目前爲止有： # extract one school ed

1熱度

1回答

開始使用plyr`m * ply`但無法重現示例

試圖學習plyr，我試圖重現代碼introductory guide。該指南指出，該代碼位於文件plyr.r中，但不是我能找到此文件的位置。但重現的第一例人似乎很容易，所以我決定試一試： dat <- data.frame(c(10,100,50), mean=c(5,5,10), sd=c(1,2,1)) maply(dat, rnorm) ，我得到這個錯誤： Error in fun

2熱度

2回答

將指標變量添加到長數據框中，以便當值從一年增加到下一個時

我有一個包含三列fyear,tic和dcvt（對於會計年度，股票代碼和總可轉換債務）的長數據框。大約有18個財政年度和幾千個代理商。我想添加一個指標變量，每當dcvt從一年上升到下一個時，這個變量就是一個。我試過ddply，但我失去了fyear列，並不確定如何找回來。 library(plyr) temp <- data.frame(fyear = rep(1992:2009, 10), ti

1熱度

1回答

從lmList對象中提取RMSE

我有以下代碼從lmList對象中提取係數。 library(lme4) library(plyr) lm.model <- lmList(Y ~ X | eventID, df) param <- ldply(lm.model, coef) 此代碼工作正常。 HOwever，這是一種提取係數的有效方法嗎？我的主要問題是，我如何從相同的lm.model對象中提取RMSE？

5熱度

2回答

R：使用ddply將函數應用於數據子集

我試圖使用ddply方法來獲取有關3000個電影的各種信息的數據幀，然後計算每個流派的平均總數。我是R新手，我已經閱讀了關於ddply的所有問題，但我似乎仍然無法做到。這是我現在有： > attach(movies) > ddply(movies, Genre, mean(Gross)) Error in llply(.data = .data, .fun = .fun, ..., .prog

23熱度

4回答

是否有一個R函數將函數應用於每對列？

我經常需要對數據框/矩陣中的每對列應用函數，並將結果以矩陣形式返回。現在我總是寫一個循環來做到這一點。例如，爲了使含我寫相關的p值的矩陣： df <- data.frame(x=rnorm(100),y=rnorm(100),z=rnorm(100)) n <- ncol(df) foo <- matrix(0,n,n) for (i in 1:n) { for (j in

7熱度

2回答

如何加速彙總和ddply？

我有一個200萬行，15列的數據框。我想用ddply對這3列進行分組（所有3個因子，並且有780,000個這些因子的獨特組合），並獲得3列的加權平均值（權重由我的數據集定義）。以下是相當快： system.time(a2 <- aggregate(cbind(col1,col2,col3) ~ fac1 + fac2 + fac3, data=aggdf, FUN=mean)) user

6熱度

2回答

如果我的分組變量是一個因素，如何生成分組彙總統計信息？

假設我想獲得關於數據集mtcars（基本R版本2.12.1的一部分）的一些彙總統計信息。下面，我根據他們擁有的發動機汽缸數量對汽車進行分組，並且採用mtcars中其餘變量的每組平均值。 > str(mtcars) 'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.