我很難過。通常情況下,read.csv
按預期工作,但我遇到了行爲出乎意料的問題。它很可能是我的用戶錯誤,但任何幫助將不勝感激。Read.CSV在R中未按預期工作
下面是對文件
http://nces.ed.gov/ipeds/datacenter/data/SFA0910.zip
的URL這裏是我的代碼來獲取文件,解壓縮,並在閱讀:
URL <- "http://nces.ed.gov/ipeds/datacenter/data/SFA0910.zip"
download.file(URL, destfile="temp.zip")
unzip("temp.zip")
tmp <- read.table("sfa0910.csv",
header=T, stringsAsFactors=F, sep=",", row.names=NULL)
這裏是我的問題。當我在Excel中打開數據CSV數據時,數據看起來像預期的那樣。當我將數據讀入R時,第一列實際上被命名爲row.names。 R正在讀取一行額外的數據,但我無法弄清楚發生「錯誤」的原因是導致row.names成爲列。簡單地說,它看起來像數據轉移。
但是,奇怪的是,R中的最後一列似乎包含正確的數據。
以下是第幾列幾行:
tmp[1:5,1:7]
row.names UNITID XSCUGRAD SCUGRAD XSCUGFFN SCUGFFN XSCUGFFP
1 100654 R 4496 R 1044 R 23
2 100663 R 10646 R 1496 R 14
3 100690 R 380 R 5 R 1
4 100706 R 6119 R 774 R 13
5 100724 R 4638 R 1209 R 26
什麼我可能做錯了什麼想法?
永遠不要假設Excel正確表示您的CSV文件的內容。相反,在文本編輯器中打開CSV(不是這是造成問題的原因,而是作爲一般規則)。 – 2012-08-15 23:36:45
刪除'row.names = NULL'參數。 – mnel 2012-08-15 23:39:09
@ttmaccer - 這很奇怪,你不需要驗證到網站。我只是從網上試過,並將文件自動下載到我的電腦。我正在使用Chrome。 – Btibert3 2012-08-15 23:41:01