tapply

0熱度

1回答

我有3列，大約是這樣的數據： uid <- c(1,1,1,1,1,1,2,2,2) sale <- c(0,1,1,0,0,0,0,1,0) e <- as.data.frame(cbind(uid, sale)) e$uid <- as.factor(e$uid) e$sincesale <- NA 對於每一個唯一的ID，我想申請相同的程序 - 計算自上次銷售以來的天數。我可以很

2熱度

2回答

分配的列名行的名稱使用lapply

像的問題後，我要分配這些都是由lapply和tapply在R.一個簡單的例子進行處理的列名： df<-data.frame('X1'=rnorm(100), 'X2'=rnorm(100), 'X3'=c(c(rep('A',50)),c(rep('B',50)))) var<-c('X1','X2') plyr::ldply(lapply(var, fun

0熱度

1回答

如何估算意味着使用purrr

我想知道爲什麼在purrr着的地圖功能解決不了這個查詢 tapply(mtcars$mpg, mtcars$cyl, mean) # 4 6 8 #26.66364 19.74286 15.10000 與 mtcars %>% split(.$cyl) %>% map(~mean(mpg)) #$4 [1] NA #$6 [1] NA #$8 [1] NA #Warning messages: 1

0熱度

1回答

具有多個因素分組和多變因子均值的水庫羣

我想創建一個barplot，顯示按單身或結婚分組的大學畢業生或非大學畢業生分組的工會和非工會工人的平均小時工資。雖然我設法構建了具有兩個因素分組的可通過的barplot，但我無法弄清楚如何使用三個因子分組來完成此操作。我所看到的例子有三個因素只是頻率計數，所以我不確定如何將所有因素中的另一個變量的平均值併入到圖中。我所希望創造的東西，看起來像這樣（在Stata創建）： Average Hourly

0熱度

1回答

當應用tapply（）時，R中數據幀的原始數字發生突然變化

我在R中使用過很多tapply（），但我不知道爲什麼在tapply（）函數後突然轉換了大小順序被申請;被應用。當我加載原始CSV數據時，數據顯示如下。 Barcode Group Price 1002-01-23 A 10.23568975 1002-01-24 A 2356.25 1002-01-25 A 123.54897 1002-01-26 A 200.154

0熱度

1回答

將數據幀整形爲GLM分析的寬格式

我有一個包含圖，物種和出現數據的3列數據框。當我使用STR（）我得到以下輸出： > str(AbundTGLMSOagg) 'data.frame': 1148 obs. of 3 variables: $ plot : Factor w/ 139 levels "H01","H02","H03",..: 1 1 1 1 1 1 1 1 1 2 ... $ species : Factor

-3熱度

2回答

將兩兩類別組合在一起

我目前正在使用一個數據集來顯示貸款的目的是貸款和每個貸款的相關貸款等級。該數據集被稱爲loancase和列的一個是目的而另一列是級。下面我有矩陣，它是按比例配對填充的。每行應該達到100％，這意味着每個條目都是該特定等級的比例。例如，行[Car，]可能看起來像20,20,0,0,20,0,0 40. 請注意，當前數據佔位符是NA，我試圖用一個向量列出每個所需的條目。 matrix(data =

0熱度

1回答

數據框中使用tapply變成零到NAS

我需要一個數據幀轉換爲基質，我使用下面的代碼矩陣的變換： LoggAbundTGLMSOagg <- tapply(AbundTGLMSOagg$occurrence,list(AbundTGLMSOagg$plot,AbundTGLMSOagg$species),mean) 我得到所需的矩陣格式，但零變成來港定居。使用tapply（），我如何保留零？我可以寫一個CSV文件 write.cs

1熱度

2回答

計算統計數據和/或R中的數據幀的子集上的多個列的函數

我有一個數據幀（以下形式的樣品）： DateTime Ind1 Ind2 V1 V2 Ac1 Ac2 w1 w2 w3 shift 2016-05-01 00:01:00 U A 5 7 20 100 50 70 200 1 2016-05-01 00:01:20 U A 5 7 20 109 35 77 140 1 2016-05-01 00:01:40 U A 5 7

0熱度

1回答

R根據日期確定新的用戶IDS

我有一個包含2年用戶短信的數據集 - 2015和2016（135,000）。我正在嘗試爲2016年2月的此計劃確定新用戶（基於subscriber_id和實體==「訂閱在線」）。皺紋是新用戶是在過去12個月內沒有在數據中發生subscriber_id的用戶。因此，舉例來說，如果我有下面的示例數據： created subscriber_id cellnum entity message