我想讀一個大的製表符分隔的文件中R.閱讀製表符分隔的數據在與R
首先我嘗試這樣做:
data <- read.table("data.csv", sep="\t")
但它讀了一些數字變量的作爲因子
所以,我想基於什麼類型我想每個變量的數據讀取是這樣的:
data <- read.table("data.csv", sep="\t", colClasses=c("character","numeric","numeric","character","boolean","numeric"))
但當我嘗試這一點,給我一個錯誤:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got '"4"'
我認爲這可能是身邊有一些最初的原始文件的數值的報價,但我不知道。
感謝您的回覆。這有幫助,但不是導入我想導入爲數字的變量,而是將它們導入爲字符。當我嘗試將其轉換爲數字變量時,它會給我所有觀察值的NA。我會仔細研究一下數據,看看你提出的建議 – Ford 2012-07-26 18:55:48
哦,仔細看看你的錯誤,你有四個引用。 「4」R已經爲它附加了一個單引號''4''。這意味着在你的tsv文件中,你的數字被引用,因此被視爲字符。在你的read.table行添加quote ='「',看看它是如何工作的 – Justin 2012-07-26 19:03:05
問題是我的原始數據文件中的值用引號引起來,所以它應該是以字符的形式讀取值數字我試過了上面提到的quote =''',但是這並不能解決問題......原始數據文件也太大,所以我不能刪除文本編輯器或Excel中的引號而不會崩潰程序 – Ford 2012-07-26 20:07:13