我反覆使用的設計模式之一是在數據框上執行「group by」或「split,apply,combine(SAC)」,然後加入聚合數據回到原始數據。例如,在計算每個縣與許多州和縣的數據框中的州平均數偏差時,這很有用。我的總計算很少是一個簡單的意思,但它是一個很好的例子。我經常解決這一問題的方式如下: require(plyr)
set.seed(1)
## set up some data
通過一些幫助,我想出瞭如何將edgelist,aka,adjacency list轉換爲adjacency matrix.我想了解如何自動執行此操作大量邊界列表,然後將得到的鄰接矩陣放入列表中。 我猜plyr是做這件事的最好方法,但是如果你想告訴我如何用循環做到這一點,我會很感激。好奇的是,這些數據代表了不同學校的社交網絡。 這裏是我到目前爲止有: # extract one school ed
試圖學習plyr,我試圖重現代碼introductory guide。 該指南指出,該代碼位於文件plyr.r中,但不是我能找到此文件的位置。 但重現的第一例人似乎很容易,所以我決定試一試: dat <- data.frame(c(10,100,50), mean=c(5,5,10), sd=c(1,2,1))
maply(dat, rnorm)
,我得到這個錯誤: Error in fun
我經常需要對數據框/矩陣中的每對列應用函數,並將結果以矩陣形式返回。現在我總是寫一個循環來做到這一點。例如,爲了使含我寫相關的p值的矩陣: df <- data.frame(x=rnorm(100),y=rnorm(100),z=rnorm(100))
n <- ncol(df)
foo <- matrix(0,n,n)
for (i in 1:n)
{
for (j in