tidyverse

1熱度

1回答

我試圖在多個csv文件的目錄中讀取，每個文件約爲7K +行和〜1800列。我有一個數據字典，可以讀入數據框，數據字典的每一行都標識變量（列）名稱以及數據類型。查看readr包中的?read_csv，可以指定列類型。但是，鑑於我有近1800列指定，我希望使用可用數據字典中的信息來指定該函數所需的適當格式的列/類型對。另一種不太理想的方法是將每一列讀作字符，然後根據需要手動修改。任何幫助，你可以

1熱度

1回答

如何導出每個分組的表在表的列表，以一個不同的Excel選項卡使用ReadXL和Tidyverse

library(dplyr) library(tidyr) library(forcats) library(readxl) 使用來自forcats包gss_cat數據集我創建了一個分組和彙總數據框然後將數據通過婚姻和種族分裂變量（如果有更好的Tidyverse方法比在這裏使用lapply會更好）。 Survey<-gss_cat%>% select(marital,race,rel

0熱度

2回答

是缺少在這兩個變量中的一個返回值R

我的數據集當然是更大的，但原理是一樣的： library(tidyverse) df <- tibble(Name1 = c("Joe", "Harry", "Jane", NA, NA), Name2 = c("Joe", "Harry", "Thomas", "Bill", "Jane")) 問題1：我怎樣才能提取值Name2（"Thomas"和 "Bill"）誰在Name1

1熱度

1回答

tidyr：轉置變量和用零

我有一個數據幀像這樣填補空白： set.seed(456) df <- data.frame(site = c(rep("Site1", 10), rep("Site2", 9)), genus = c(rep("sp1", 5), rep("sp2", 5), rep("sp1", 5), rep("sp2", 2), rep("sp3", 2)), abun

1熱度

1回答

R：使用dplyr縮放多個列的子集（具有相似的名稱）

我最近從R中的常見數據框操作轉移到了tidyverse。但是我有一個關於使用scale()函數縮放列的問題。我的數據由其中一些數字和一些分類特徵的列組成。最後一列是數據的y值。所以我想縮放所有數字列，但不是最後一列。使用select()函數，我可以編寫很短的代碼行，並選擇需要縮放的所有數字列，如果我添加ends_with("...")參數。但我無法通過縮放來真正利用它。在那裏，我必須使用tra

4熱度

4回答

dplyr：取消選擇由

給出的列如何取消選擇自編函數的參數...中給出的列。（我還需要選擇在另一點列，所以只是在-指定...列不解決我的問題。）任何soltions是apreciated，select -helpers，操縱quosures或表達式，... # very simple example data test <- data.frame(a=1:3, b=1:3, c=1:3) # function

1熱度

2回答

有條件地將列中的值替換爲另一列中的值使用dplyr

我非常努力地找到答案，如果它是重複的，我很抱歉。我會製作一些虛擬數據來解釋我的問題。 tibble(a=c(0.1, 0.2, 0.3), sample1 = c(0, 1, 1), sample2 = c(1, 1, 0)) # A tibble: 3 x 3 a sample1 sample2 <dbl> <dbl> <dbl> 1 0.1 0 1 2 0.2 1

-2熱度

2回答

如何通過分組數據來減少數據幀？

:) 是否有一種簡單的方法可以將某個特定的數據集合分組爲一個簡化的數據框？我正在考慮一個算法，但是R中有沒有可用於此的函數？我試圖使用dplyr，但它didin't很好地工作...... 如： PS：我的數據是在1GB以上的矩陣，這是，我需要一個更自動的過程。示例數據： structure(list(Nun = 1:6, Event = c(1L, 1L, 1L, 1L, 2L, 2L),

2熱度

2回答

通過

組從等於最高值的值數據框中選擇多行我有一個數據幀，看起來像這樣： query <- c('a','a','a','b','b','b','c','c','c') hit <- c(1,2,3,4,5,6,7,8,9) score <- c(97,97,96,98,97,96,99,99,98) df <- data.frame(query,hit,score) df quer

0熱度

2回答

使用ggplot2，dplyr和forcats使用自定義函數繪製降頻條形圖

我有很多數據，需要按照降序排列創建條形圖。如果我在功能之外執行此操作，則此post中顯示的解決方案可以工作，但在功能內部使用時不適用。這是一個用例。 library(forcats) library(tidyverse) dat <- data.frame( x = rep(letters[1:5], times=c(3,11,8, 2, 7)) ) plot_freq <-