2013-07-05 167 views
0

我第一次使用統計軟件,並且正在與R掙扎。我收集了數據並將它們轉換爲csv(由於某些原因,使用「;」而不是「;」分隔)並導入進入R,這工作正常。如果我使用str函數並查看摘要,但是我有因子變量以及int變量,但不知道如何更改它,因爲我之前在excel中格式化了所有列,並且它們都表示數字。我想爲我的論文做一個多元迴歸,但是甚至無法正確上傳數據,所以我希望有任何幫助。將數據加載到R

此外,有沒有人知道我可以在R中包含多少解釋變量?

在此先感謝。

+1

路易莎歡迎來到SO。請閱讀[this](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)下次更好地提出問題。 – agstudy

+0

您可以使用'read.csv(「myData.csv」,stringsAsFactors = FALSE)'來保存Excel將數據轉換爲的格式。爲什麼你將所有格式都設置爲數字,但Excel仍然保存爲字符,你需要通過查看csv文件中的數據來找出結果。 – vaettchen

+0

如果缺少觀察記錄,例如,'。'在您的Excel數據文件中嘗試包括na.strings =「。」在你的read.csv語句中。 –

回答

5

許多選項,將您的價值轉換爲數字,如使用as.numeric但更好的是在read.csv中使用colClasses選項。這確保以正確的格式讀取您的數據。

例如:

read.csv(filename, sep=';', 
        colClasses=c("character",  ## first column is a character 
            rep("numeric",4)) ## followed by 4 numeric varaibles. 

您還可以在這個conjonction,使用參數stringsAsFactors=FALSE如果你有超過5個變量,你不想字符串轉換爲因素。

更多的說明可以在??read.csv找到或者更一般??read.table

爲您不明的問題:「我能有多少解釋變量包括R'」 ,我認爲可以讀取多少列/變量。讀取或創建矩陣/數據幀的唯一限制是您的RAM。

0

如果read.csv是進口一些您認爲數字變量因素或字符串,它很可能是你有在那些NULLNA或其他一些非數字值列中的值。檢查非數字條目的級別或值,並在Excel或R本身中消除/處理它們。一旦事情是純數字,它應該正常讀取,或者您可以使用as.integer()as.numeric()進行後處理。

+0

謝謝。在我的數據中,我確實有一些公認的假人,我想我必須承認,在某種程度上R?目前這些虛擬人物的形式爲「int」,但其他純粹數字的人物如「收入」顯示爲因素......我會嘗試使用數字。 – Luisa

+0

路易莎你有多少變量?爲什麼不明確定義colClasses? – agstudy

+0

有42個變量(我知道這很多,但我的教授確定它會工作)。我必須閱讀colClasses,從未聽說過它。 – Luisa