我第一次使用統計軟件,並且正在與R掙扎。我收集了數據並將它們轉換爲csv(由於某些原因,使用「;」而不是「;」分隔)並導入進入R,這工作正常。如果我使用str函數並查看摘要,但是我有因子變量以及int變量,但不知道如何更改它,因爲我之前在excel中格式化了所有列,並且它們都表示數字。我想爲我的論文做一個多元迴歸,但是甚至無法正確上傳數據,所以我希望有任何幫助。將數據加載到R
此外,有沒有人知道我可以在R中包含多少解釋變量?
在此先感謝。
我第一次使用統計軟件,並且正在與R掙扎。我收集了數據並將它們轉換爲csv(由於某些原因,使用「;」而不是「;」分隔)並導入進入R,這工作正常。如果我使用str函數並查看摘要,但是我有因子變量以及int變量,但不知道如何更改它,因爲我之前在excel中格式化了所有列,並且它們都表示數字。我想爲我的論文做一個多元迴歸,但是甚至無法正確上傳數據,所以我希望有任何幫助。將數據加載到R
此外,有沒有人知道我可以在R中包含多少解釋變量?
在此先感謝。
許多選項,將您的價值轉換爲數字,如使用as.numeric
但更好的是在read.csv
中使用colClasses
選項。這確保以正確的格式讀取您的數據。
例如:
read.csv(filename, sep=';',
colClasses=c("character", ## first column is a character
rep("numeric",4)) ## followed by 4 numeric varaibles.
您還可以在這個conjonction,使用參數stringsAsFactors=FALSE
如果你有超過5個變量,你不想字符串轉換爲因素。
更多的說明可以在??read.csv
找到或者更一般??read.table
爲您不明的問題:「我能有多少解釋變量包括R'」 ,我認爲可以讀取多少列/變量。讀取或創建矩陣/數據幀的唯一限制是您的RAM。
如果read.csv
是進口一些您認爲數字變量因素或字符串,它很可能是你有在那些NULL
,NA
或其他一些非數字值列中的值。檢查非數字條目的級別或值,並在Excel或R本身中消除/處理它們。一旦事情是純數字,它應該正常讀取,或者您可以使用as.integer()
或as.numeric()
進行後處理。
路易莎歡迎來到SO。請閱讀[this](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)下次更好地提出問題。 – agstudy
您可以使用'read.csv(「myData.csv」,stringsAsFactors = FALSE)'來保存Excel將數據轉換爲的格式。爲什麼你將所有格式都設置爲數字,但Excel仍然保存爲字符,你需要通過查看csv文件中的數據來找出結果。 – vaettchen
如果缺少觀察記錄,例如,'。'在您的Excel數據文件中嘗試包括na.strings =「。」在你的read.csv語句中。 –