2016-03-01 33 views
1

我有一個名爲「rating.csv」的數據集。該數據集是這樣的:指定col.classes在read.csv中的錯誤

rating: 2.97, 3, 3, 3.41, 3.5, 3.5, 4, NULL, NULL, NULL, 3.67

我想在read.csv指定colClasses加快csv文件的讀取。首先,我創建colClasses這樣的:

classes <- c("double") 

然後,我

data <- read.csv('rating.csv', colClasses=classes, 
    comment.char="", na.strings='NULL') 

讀取數據集,但我得到一個錯誤與此read.csv

Error in scan(file, what, nmax, sep, dec, quote, skip, 
nlines, na.strings, : scan() expected 'a real', got '"3.67"' 

你有什麼想法這段代碼有什麼問題?或者還有另一種方法來改變數據集類的類型,除了read.csv

+1

我認爲我們需要看到數據集本身。你能發佈一個鏈接嗎? –

+1

錯誤似乎表明最後一列是字符,而不是數字。 – 2016-03-01 03:13:39

回答

0

我認爲這意味着您的數據是字符串格式而不是數字/雙/無論選項可用csv格式。