我試圖使用ff
包將大型(370萬行,180列)數據集讀入R中。數據集中有幾種數據類型 - 因子,邏輯和數字。使用read.csv.ffdf()會拋出一個錯誤
問題是在讀數值變量時。例如,我的專欄之一是:
TotalBeforeTax
126.9
88.0
124.5
90.9
...
當我嘗試在讀取數據時,被拋出了以下錯誤:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got '"126.90000"'
我想聲明的類integer
(它已經被聲明爲numeric
)使用colClasses
的說法,但無濟於事。我也試着將其更改爲a real
(不管是應該的意思),並開始讀取數據,但在某些時候拋出:
Error in methods::as(data[[i]], colClasses[i]) :
no method or default for coercing 「character」 to 「a real」
(我的猜測是,因爲它遇到一個NA
並沒有按我不知道該怎麼處理它。)
有趣的是,如果我將該列聲明爲factor
,則所有內容都會很好地讀取。
什麼給?
另請參見http://stackoverflow.com/questions/22357396/ff-in-r-no-applicable-method-for-recodelevels – jwijffels