我想讀的CSV文件完全相同的格式如下:的R - 對包含數千數字列讀取CSV分離器
Date,x,y
"2015/08/01","71,131","20,390"
"2015/08/02","81,599","23,273"
"2015/08/03","79,435","21,654"
"2015/08/04","80,733","20,924"
的分隔符是逗號,但每個值也被封入因爲報價用作千位分隔符的逗號。我嘗試了{readr}中的read.csv
,read_csv
和{data.table}中的fread
,我能做的最好的是讀取所有值爲字符串,然後使用as.numeric
和gsub
的組合將它們轉換爲數字。
我也發現這個:Most elegant way to load csv with point as thousands separator in R這是非常有用的,但我的數據有很多列(不是所有的數字),我寧可不指定列類型。
任何想法或我應該開始gsub ing?在有趣的一面,Excel讀取文件就好:)
你知道哪些列已進行改造? – Jaap
@Jaap我想,但至少它會正確讀取它。剛纔看到他們已經試過了。 nvm –
David - 我不確定那會完成什麼。無論如何,我得到這個錯誤:'期望的sep(''),但新行,EOF(或其他非打印字符)結束字段4時檢測類型(第一):輸入新的日期:(mm-dd-yy)' – BogdanC