dplyr

    -2熱度

    1回答

    我正在從STATA轉換爲R.我正努力複製的一件事是STATA的重塑功能。 在STATA大致這是可以做到用: reshape wide variable names, i(Unique person ID) j(ID identifying each entry per unique ID i) 我有一個包含由患者使用的靜脈內線路的數據集(樣品現在附)。該數據是目前龍(每1行)線。對於每一行你會

    3熱度

    1回答

    我有一個大的JSON文件(8 GB,800萬個案例),但我只需要它的一個小樣本。簡單的stream_in不起作用,因爲文件太大。 爲了解決這個問題,我想下面的代碼: books <- list("Books_5.json") books <- map(books, ~ stream_in(file(.x)) %>% sample_n(385)) books <- as.data.frame(b

    0熱度

    1回答

    我讀過Programming with dplyr文檔,並試圖編寫一個圍繞case_when()函數的簡單函數。 library(dplyr) data_test <- data.frame( a = rep(c("a", "b", "c"), each = 5), b = rnorm(15) ) fun_test <- function(df, var1, var2)

    0熱度

    2回答

    我的數據集當然是更大的,但原理是一樣的: library(tidyverse) df <- tibble(Name1 = c("Joe", "Harry", "Jane", NA, NA), Name2 = c("Joe", "Harry", "Thomas", "Bill", "Jane")) 問題1:我怎樣才能提取值Name2("Thomas"和 "Bill")誰在Name1

    0熱度

    1回答

    我想在dplyr的mutate中使用switch語句。我有一個簡單的函數,執行某些操作,並且經由開關分配的替代值,例如: convert_am <- function(x) { x <- as.character(x) switch(x, "0" = FALSE, "1" = TRUE, NA) } 這個工作過程需要時施加到標量:

    1熱度

    1回答

    考慮: x <- data.frame(Participant=c("1","1","1","1","1","1","1","1","1","1", "2","2","2","2","2","2","2","2","2","2", "3","3","3","3","3","3","3","3","3","3"), Day= c("1","2","3","4"

    1熱度

    1回答

    我最近從R中的常見數據框操作轉移到了tidyverse。但是我有一個關於使用scale()函數縮放列的問題。 我的數據由其中一些數字和一些分類特徵的列組成。最後一列是數據的y值。所以我想縮放所有數字列,但不是最後一列。 使用select()函數,我可以編寫很短的代碼行,並選擇需要縮放的所有數字列,如果我添加ends_with("...")參數。但我無法通過縮放來真正利用它。在那裏,我必須使用tra

    1熱度

    1回答

    我想從給定的csv文件「life.expectancy」中獲取平均變化最高的區域的名稱。我使用了「dplyr」包,但是,當我嘗試在最後一步中檢索區域的名稱時,出現以下錯誤: lapply(.x,.f,...)中的錯誤:object'average .change'找不到。有沒有一種方法可以得到與最大變化相對應的區域名稱? 編輯:我用max(grouped.by.region $ average.c

    4熱度

    4回答

    給出的列 如何取消選擇自編函數的參數...中給出的列。 (我還需要選擇在另一點列,所以只是在-指定...列不解決我的問題。) 任何soltions是apreciated,select -helpers,操縱quosures或表達式,... # very simple example data test <- data.frame(a=1:3, b=1:3, c=1:3) # function

    1熱度

    2回答

    我正試圖找到一種更好的方法,以基於列名部分的列組合來運行mutate()。 例如,一種方式,以簡化在以下代碼mutate功能: df <- data.frame(LIMITED_A = c(100,200), UNLIMITED_A = c(25000,50000), LIMITED_B = c(300,300), UNLIMITED_B = c(5