plyr

    3熱度

    2回答

    我最近問了一個關於統計一個元素自身重複次數的問題(http://stackoverflow.com/questions/7669553/how-to-assign-在大數據框中重複數據塊到基於數據幀的元素識別/ 7669607#7669607)。我收到了一些非常有用的建議,這些建議對少量行有效,但現在需要在更大的層面上執行操作(超過255k行,使用ddply形成大約100k個「組」): syste

    3熱度

    1回答

    我有一個再發問題 - 我很抱歉! 假設我想要根據'id'和'year'列出棒球數據(來自plyr包)。有根據要麼創建列表之間的差異: 1. mylist1 <- dlply(baseball, .(id, year), identity) 和 2. mylist2 <- dlply(baseball, .(id), dlply, .(year), identity) 在列表中的組織方式 ,

    1熱度

    1回答

    我從包含2列(idDoc,標記)的MySQL表中獲取數據,該表描述文檔具有給定標記。當我使用的數據幀與 ddply(tags,1) 我的目標是通過ID組標籤,所以說我做以下步驟 > x=c(1,1,2,2) > y=c(4,5,6,7) > data.frame(x,y) x y 1 1 4 2 1 5 3 2 6 4 2 7 我所需的輸出是可能列出的清單(或任何其他

    5熱度

    1回答

    我有這樣的功能: > λ.est <- function(x){ mle.optim <- mle2(paretoNLL,start=list(λ=-0.7),data=list(x=x),trace=TRUE) return(summary(mle.optim)@coef[1,1:4]) } 適合分配和retuns參數估計,標準。錯誤,z值和我的模型

    3熱度

    1回答

    道歉是這是一個更經驗豐富的R用戶會知道,但我只是碰到這個問題,想問一下正確的用法。 似乎有可能通過使用as.factor來分類變量的範圍。所以,我可以將觀察分成一個範圍。例如,如果我正在查看用戶的訪問,則看起來我可以編寫if/then語句來按用戶的訪問範圍對用戶進行分類,然後根據組獲得摘要統計信息。 這裏就是我得知這個鏈接:http://programming-r-pro-bro.blogspot

    3熱度

    2回答

    的子集我有一個數據幀: > df <- data.frame( + Species = rep(LETTERS[1:4], times=c(5,6,7,6)), + Length = rep(11:14, each=3) +) > > df 我需要能夠計數在一定的個體數量長度每種物種(即物種A中有多少個體的長度爲1,2,3等)?然後,我需要對輸出執行一系列附加分析。例如,我需要計算每個

    0熱度

    1回答

    我有一個數據格式爲 PERSON_A PERSON_B MEET LEAVE ,基本上說明了當PERSON_A相識時間滿足PERSON_B,他們說在此刻離開「再見」給對方。時間以秒錶示,並且在http://pastie.org/2825794(simple.dat)上有一小部分數據。 我需要的是計算按天分組的會議數。目前,我有一個可行的代碼,外觀並不漂亮。無論如何,我想要一個幫助,以便將它轉換

    1熱度

    2回答

    我使用ddply來避免冗餘計算。 我經常處理分割子集內保存的值,並進行非聚合分析。所以爲了避免這個(一個玩具的例子): ddply(baseball,.(id,year),function(x){paste(x$id,x$year,sep="_")}) Error in list_to_dataframe(res, attr(.data, "split_labels")) : Res

    2熱度

    3回答

    我的按日期對陣各隊進球一個數據幀(DF) gamedate teamID Gls 1992-08-22 CHL 3 1992-08-22 MNU 1 1992-08-23 ARS 0 1992-08-23 LIV 2 1992-08-24 MNU 0 1992-08-25 LIV 2 1992-08-26 ARS 0 1992-08-26 CHL 0 我希望生產這表明玩過遊戲的

    1熱度

    2回答

    我想在每個bvar級別內單獨應用avar。 mydf <- data.frame(avar = c("A", "B", "C", 4, 5, 6, 7, 8, 9, 10), bvar = rep(1:2, each = 5)) mydf avar bvar 1 A 1 2 B 1 3 C 1 4 4 1 5 5 1 6 6 2 7 7 2 8 8 2