1
我有一個名爲「rating.csv」的數據集。該數據集是這樣的:指定col.classes在read.csv中的錯誤
rating: 2.97, 3, 3, 3.41, 3.5, 3.5, 4, NULL, NULL, NULL, 3.67
我想在read.csv指定colClasses加快csv文件的讀取。首先,我創建colClasses這樣的:
classes <- c("double")
然後,我
data <- read.csv('rating.csv', colClasses=classes,
comment.char="", na.strings='NULL')
讀取數據集,但我得到一個錯誤與此read.csv
Error in scan(file, what, nmax, sep, dec, quote, skip,
nlines, na.strings, : scan() expected 'a real', got '"3.67"'
你有什麼想法這段代碼有什麼問題?或者還有另一種方法來改變數據集類的類型,除了read.csv
?
我認爲我們需要看到數據集本身。你能發佈一個鏈接嗎? –
錯誤似乎表明最後一列是字符,而不是數字。 – 2016-03-01 03:13:39