dplyr

    54熱度

    2回答

    我有兩個數據幀,我想要使用dplyr加入。一個是包含名字的數據框。 test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) 其他數據框包含清理版本的Kantrowitz名稱語料庫,用於標識性別。下面是一個小例子: k

    2熱度

    1回答

    在使用R時,我經常感興趣的是對data.frame執行操作,其中我根據組彙總變量,然後希望將這些彙總值添加回數據。幀。 myDF <- data.frame(A = runif(5), B = c("A", "A", "A", "B", "B")) myDF$Total <- with(myDF, by(A, B, sum))[myDF$B] myDF$Proportion <- with(m

    1熱度

    1回答

    這裏是我想的名字的性別編碼隨着時間的推移一些樣本數據: names_to_encode <- structure(list(names = structure(c(2L, 2L, 1L, 1L, 3L, 3L), .Label = c("jane", "john", "madison"), class = "factor"), year = c(1890, 1990, 1890, 1990, 18

    2熱度

    3回答

    展開的大數據幀我有一個數據幀 df <- data.frame( id = c(1, 1, 1, 2, 2, 3, 3, 3, 3, 4), date = c("1985-06-19", "1985-06-19", "1985-06-19", "1985-08-01", "1985-08-01", "1990-06-19", "1990-06-19", "1990-

    3熱度

    1回答

    我試圖做使用dplyr如下因素: 假設你有data.framey和你想的基礎上var1 y <- data.frame(var1 = rnorm(100)) y$var2 <- 0 y$var2[y$var1 > 0.5] <- 1 值來創建一個新的變量是否可以使用dplyr的mutate和filter來做到這一點?

    1熱度

    1回答

    使用robCompositions包,我需要在組的基礎上推算缺失值。例如,使用虹膜數據集。 library(robCompositions) library(dplyr) data(iris) # Insert random NAs for (i in 1:4) { n_NA = sample(0:10, 1) index_NA = sample(1:nrow(iri

    2熱度

    1回答

    我可以使用循環來回答這個問題,我想不用(最好在dplyr或plyr中)。 我有一個數據幀和國家的名單 Data <- data.frame( Date = c(2012:2014,2014,2013:2014), Value = rnorm(6), ) Countries <- c("AUS","USA","UK") 數據幀看起來像這樣 Date Value 1 2

    4熱度

    1回答

    我不知道這是可能的,但如果它是,它將使生活是如此的效率高得多。 普遍的問題,這將是有趣的更廣泛的SO社區:for循環(和鹼功能類似於申請)適用於一般/一貫作業,如添加X到的數據幀的每列或行。我有一個普通/一致的操作我要執行,但對於數據幀中的每個元素的獨特值。 有沒有辦法比子集化我的數據幀的每一個分組,應用相對具體的數字的函數來分組,然後重新組合更有效地做到這一點?我不在乎它是否爲for循環或適用,

    0熱度

    1回答

    我想通過以下對pwr.t.test: > twelve fail sampsize sd 1 0.047619 21 0.9759 2 0.000000 28 0.0000 3 0.000000 1 0.0000 4 0.000000 13 0.0000 5 0.000000 1 0.0000 6 0.000000 1 0.0000 7 0.000000

    17熱度

    1回答

    我想使用dplyr將一個表按一列分組,然後將函數應用於每個組的第二列中的一組值。 例如,在下面的代碼示例中,我想返回每個人所吃的食物的2項組合。我無法弄清楚如何在do()功能中正確提供功能和正確的色譜柱(食品)。 library(dplyr) person = c('Grace', 'Grace', 'Grace', 'Rob', 'Rob', 'Rob') foods = c('apple