我想讀入並將多個文本文件合併爲R.與此問題是,我已經給出了一些數據,其中文件之間的字段分隔符是不同的(例如一個標籤和另一個逗號)。我怎樣纔能有效地結合這些? (標籤)R中的文本文件與不同分隔符
數據1::(逗號)
v1 v2 v3 v4 v5
1 2 3 4 urban
4 5 3 2 city
數據2:佈局的例子
v1,v2,v3,v4,v5
5,6,7,8,rural
6,4,3,1,city
這個例子顯然不是真實的,真正的代碼有近半萬點!所以不能重塑原始文件。到目前爲止我使用的代碼是:
filelist <- list.files(path = "~/Documents/", pattern='.dat', full.names=T)
data1 <- ldply(filelist, function(x) read.csv(x, sep="\t"))
data2 <- ldply(filelist, function(x) read.csv(x, sep=","))
這給了我兩種方式的數據,然後我需要手動清理然後合併。有沒有一種方式使用sep
可以刪除它?列名稱在文件中相同。我知道stringr
或其他連接函數可能很有用,但我也需要同時加載數據,並且不確定如何在讀命令中設置它。
你試過'fread'從 「data.table」 作爲替代'閱讀.csv'?它通常可以通過掃描文件來自動檢測分隔符。 – A5C1D2H2I1M1N2O1R2T1