所以我有一堆excel文件我想循環讀取特定的不連續的列到數據框中。使用readxl
作品像這樣的基本的東西:R按列名讀取excel
library(readxl)
library(plyr)
wb <- list.files(pattern = "*.xls")
dflist <- list()
for (i in wb){
dflist[[i]] <- data.frame(read_excel(i, sheet = "SheetName", skip=3, col_names = TRUE))
}
# now put them into a data frame
data <- ldply(dflist, data.frame, .id = NULL)
這工作(勉強),但問題是我的Excel文件有大約114列,我只希望特定的人。我也不想讓R
猜測col_types
,因爲它會混淆它們中的一些(例如,對於字符串列,如果第一個值以數字開頭,它會嘗試將整列解釋爲數字,並且崩潰)。所以我的問題是:如何指定特定的不連續列來讀取? range
參數使用cell_ranger
包,該包不允許讀取不連續的列。那麼任何替代方案
是否有可能爲你的Excel文件保存爲從他們的CSV文件並導入? – user1945827
我有超過100個,每個有多個表...所以...不:) – Alex