plyr

    1熱度

    2回答

    我有一個小麻煩創建使用ineq()庫,計算基尼係數中的命令一個新的變量。我給ineq命令的向量是我感興趣的列的列表。我想爲每個單獨的行運行此命令,然後追加新的變量。 當我嘗試這是一個循環或使用ddply(這我剛纔學習),輸出是一樣的基尼得分(整個數據集)的每一行。 我怎樣才能運行此命令爲每個行?提前致謝! library(ineq) df <- data.frame(user = 1:5, v1

    17熱度

    5回答

    我反覆使用的設計模式之一是在數據框上執行「group by」或「split,apply,combine(SAC)」,然後加入聚合數據回到原始數據。例如,在計算每個縣與許多州和縣的數據框中的州平均數偏差時,這很有用。我的總計算很少是一個簡單的意思,但它是一個很好的例子。我經常解決這一問題的方式如下: require(plyr) set.seed(1) ## set up some data

    0熱度

    2回答

    通過一些幫助,我想出瞭如何將edgelist,aka,adjacency list轉換爲adjacency matrix.我想了解如何自動執行此操作大量邊界列表,然後將得到的鄰接矩陣放入列表中。 我猜plyr是做這件事的最好方法,但是如果你想告訴我如何用循環做到這一點,我會很感激。好奇的是,這些數據代表了不同學校的社交網絡。 這裏是我到目前爲止有: # extract one school ed

    1熱度

    1回答

    試圖學習plyr,我試圖重現代碼introductory guide。 該指南指出,該代碼位於文件plyr.r中,但不是我能找到此文件的位置。 但重現的第一例人似乎很容易,所以我決定試一試: dat <- data.frame(c(10,100,50), mean=c(5,5,10), sd=c(1,2,1)) maply(dat, rnorm) ,我得到這個錯誤: Error in fun

    2熱度

    2回答

    我有一個包含三列fyear,tic和dcvt(對於會計年度,股票代碼和總可轉換債務)的長數據框。大約有18個財政年度和幾千個代理商。我想添加一個指標變量,每當dcvt從一年上升到下一個時,這個變量就是一個。 我試過ddply,但我失去了fyear列,並不確定如何找回來。 library(plyr) temp <- data.frame(fyear = rep(1992:2009, 10), ti

    1熱度

    1回答

    我有以下代碼從lmList對象中提取係數。 library(lme4) library(plyr) lm.model <- lmList(Y ~ X | eventID, df) param <- ldply(lm.model, coef) 此代碼工作正常。 HOwever,這是一種提取係數的有效方法嗎? 我的主要問題是,我如何從相同的lm.model對象中提取RMSE?

    5熱度

    2回答

    我試圖使用ddply方法來獲取有關3000個電影的各種信息的數據幀,然後計算每個流派的平均總數。我是R新手,我已經閱讀了關於ddply的所有問題,但我似乎仍然無法做到。這是我現在有: > attach(movies) > ddply(movies, Genre, mean(Gross)) Error in llply(.data = .data, .fun = .fun, ..., .prog

    23熱度

    4回答

    我經常需要對數據框/矩陣中的每對列應用函數,並將結果以矩陣形式返回。現在我總是寫一個循環來做到這一點。例如,爲了使含我寫相關的p值的矩陣: df <- data.frame(x=rnorm(100),y=rnorm(100),z=rnorm(100)) n <- ncol(df) foo <- matrix(0,n,n) for (i in 1:n) { for (j in

    7熱度

    2回答

    我有一個200萬行,15列的數據框。我想用ddply對這3列進行分組(所有3個因子,並且有780,000個這些因子的獨特組合),並獲得3列的加權平均值(權重由我的數據集定義)。以下是相當快: system.time(a2 <- aggregate(cbind(col1,col2,col3) ~ fac1 + fac2 + fac3, data=aggdf, FUN=mean)) user

    6熱度

    2回答

    假設我想獲得關於數據集mtcars(基本R版本2.12.1的一部分)的一些彙總統計信息。 下面,我根據他們擁有的發動機汽缸數量對汽車進行分組,並且採用mtcars中其餘變量的每組平均值。 > str(mtcars) 'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.