tidyverse

    1熱度

    1回答

    我試圖在多個csv文件的目錄中讀取,每個文件約爲7K +行和〜1800列。我有一個數據字典,可以讀入數據框,數據字典的每一行都標識變量(列)名稱以及數據類型。 查看readr包中的?read_csv,可以指定列類型。但是,鑑於我有近1800列指定,我希望使用可用數據字典中的信息來指定該函數所需的適當格式的列/類型對。 另一種不太理想的方法是將每一列讀作字符,然後根據需要手動修改。 任何幫助,你可以

    1熱度

    1回答

    library(dplyr) library(tidyr) library(forcats) library(readxl) 使用來自forcats包gss_cat數據集我創建了一個分組和彙總數據框然後將數據通過婚姻和種族分裂變量(如果有更好的Tidyverse方法比在這裏使用lapply會更好)。 Survey<-gss_cat%>% select(marital,race,rel

    0熱度

    2回答

    我的數據集當然是更大的,但原理是一樣的: library(tidyverse) df <- tibble(Name1 = c("Joe", "Harry", "Jane", NA, NA), Name2 = c("Joe", "Harry", "Thomas", "Bill", "Jane")) 問題1:我怎樣才能提取值Name2("Thomas"和 "Bill")誰在Name1

    1熱度

    1回答

    我有一個數據幀像這樣填補空白: set.seed(456) df <- data.frame(site = c(rep("Site1", 10), rep("Site2", 9)), genus = c(rep("sp1", 5), rep("sp2", 5), rep("sp1", 5), rep("sp2", 2), rep("sp3", 2)), abun

    1熱度

    1回答

    我最近從R中的常見數據框操作轉移到了tidyverse。但是我有一個關於使用scale()函數縮放列的問題。 我的數據由其中一些數字和一些分類特徵的列組成。最後一列是數據的y值。所以我想縮放所有數字列,但不是最後一列。 使用select()函數,我可以編寫很短的代碼行,並選擇需要縮放的所有數字列,如果我添加ends_with("...")參數。但我無法通過縮放來真正利用它。在那裏,我必須使用tra

    4熱度

    4回答

    給出的列 如何取消選擇自編函數的參數...中給出的列。 (我還需要選擇在另一點列,所以只是在-指定...列不解決我的問題。) 任何soltions是apreciated,select -helpers,操縱quosures或表達式,... # very simple example data test <- data.frame(a=1:3, b=1:3, c=1:3) # function

    1熱度

    2回答

    我非常努力地找到答案,如果它是重複的,我很抱歉。 我會製作一些虛擬數據來解釋我的問題。 tibble(a=c(0.1, 0.2, 0.3), sample1 = c(0, 1, 1), sample2 = c(1, 1, 0)) # A tibble: 3 x 3 a sample1 sample2 <dbl> <dbl> <dbl> 1 0.1 0 1 2 0.2 1

    -2熱度

    2回答

    :) 是否有一種簡單的方法可以將某個特定的數據集合分組爲一個簡化的數據框?我正在考慮一個算法,但是R中有沒有可用於此的函數?我試圖使用dplyr,但它didin't很好地工作...... 如: PS:我的數據是在1GB以上的矩陣,這是,我需要一個更自動的過程。 示例數據: structure(list(Nun = 1:6, Event = c(1L, 1L, 1L, 1L, 2L, 2L),

    2熱度

    2回答

    組 從等於最高值的值數據框中選擇多行我有一個數據幀,看起來像這樣: query <- c('a','a','a','b','b','b','c','c','c') hit <- c(1,2,3,4,5,6,7,8,9) score <- c(97,97,96,98,97,96,99,99,98) df <- data.frame(query,hit,score) df quer

    0熱度

    2回答

    我有很多數據,需要按照降序排列創建條形圖。如果我在功能之外執行此操作,則此post中顯示的解決方案可以工作,但在功能內部使用時不適用。 這是一個用例。 library(forcats) library(tidyverse) dat <- data.frame( x = rep(letters[1:5], times=c(3,11,8, 2, 7)) ) plot_freq <-