dplyr

54熱度

2回答

我有兩個數據幀，我想要使用dplyr加入。一個是包含名字的數據框。 test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) 其他數據框包含清理版本的Kantrowitz名稱語料庫，用於標識性別。下面是一個小例子： k

2熱度

1回答

按組拉伸行間彙總值

在使用R時，我經常感興趣的是對data.frame執行操作，其中我根據組彙總變量，然後希望將這些彙總值添加回數據。幀。 myDF <- data.frame(A = runif(5), B = c("A", "A", "A", "B", "B")) myDF$Total <- with(myDF, by(A, B, sum))[myDF$B] myDF$Proportion <- with(m

1熱度

1回答

傳承ddply分裂的當前值功能

這裏是我想的名字的性別編碼隨着時間的推移一些樣本數據： names_to_encode <- structure(list(names = structure(c(2L, 2L, 1L, 1L, 3L, 3L), .Label = c("jane", "john", "madison"), class = "factor"), year = c(1890, 1990, 1890, 1990, 18

2熱度

3回答

如何R中

展開的大數據幀我有一個數據幀 df <- data.frame( id = c(1, 1, 1, 2, 2, 3, 3, 3, 3, 4), date = c("1985-06-19", "1985-06-19", "1985-06-19", "1985-08-01", "1985-08-01", "1990-06-19", "1990-06-19", "1990-

3熱度

1回答

使用dplyr創建虛擬變量

我試圖做使用dplyr如下因素：假設你有data.framey和你想的基礎上var1 y <- data.frame(var1 = rnorm(100)) y$var2 <- 0 y$var2[y$var1 > 0.5] <- 1 值來創建一個新的變量是否可以使用dplyr的mutate和filter來做到這一點？

1熱度

1回答

dplyr：按組分組操作具有多個參數的函數

使用robCompositions包，我需要在組的基礎上推算缺失值。例如，使用虹膜數據集。 library(robCompositions) library(dplyr) data(iris) # Insert random NAs for (i in 1:4) { n_NA = sample(0:10, 1) index_NA = sample(1:nrow(iri

2熱度

1回答

在R中沒有循環的綁定

我可以使用循環來回答這個問題，我想不用（最好在dplyr或plyr中）。我有一個數據幀和國家的名單 Data <- data.frame( Date = c(2012:2014,2014,2013:2014), Value = rnorm(6), ) Countries <- c("AUS","USA","UK") 數據幀看起來像這樣 Date Value 1 2

4熱度

1回答

大規模唯一值的工作（for循環，應用或plyr）

我不知道這是可能的，但如果它是，它將使生活是如此的效率高得多。普遍的問題，這將是有趣的更廣泛的SO社區：for循環（和鹼功能類似於申請）適用於一般/一貫作業，如添加X到的數據幀的每列或行。我有一個普通/一致的操作我要執行，但對於數據幀中的每個元素的獨特值。有沒有辦法比子集化我的數據幀的每一個分組，應用相對具體的數字的函數來分組，然後重新組合更有效地做到這一點？我不在乎它是否爲for循環或適用，

0熱度

1回答

一個數據幀的傳遞兩列pwr.t.test

我想通過以下對pwr.t.test： > twelve fail sampsize sd 1 0.047619 21 0.9759 2 0.000000 28 0.0000 3 0.000000 1 0.0000 4 0.000000 13 0.0000 5 0.000000 1 0.0000 6 0.000000 1 0.0000 7 0.000000

17熱度

1回答

dplyr：如何將do（）應用於group_by的結果？

我想使用dplyr將一個表按一列分組，然後將函數應用於每個組的第二列中的一組值。例如，在下面的代碼示例中，我想返回每個人所吃的食物的2項組合。我無法弄清楚如何在do()功能中正確提供功能和正確的色譜柱（食品）。 library(dplyr) person = c('Grace', 'Grace', 'Grace', 'Rob', 'Rob', 'Rob') foods = c('apple