我有大約90個變量存儲在數據[2-90]中。我懷疑其中4個將與數據有拋物線般的相關性[1]。我想確定哪些具有相關性。有沒有簡單快捷的方法來做到這一點?在R中找到非線性相關關係
我試圖建立這樣一個模型(我可以在一個循環爲每個變量i = 2:90做):
y <- data$AvgRating
x <- data$Hamming.distance
x2 <- x^2
quadratic.model = lm(y ~ x + x2)
然後看看R^2 /係數,以得到一個關聯的想法。有沒有更好的方法來做到這一點?
也許R可以用90個變量建立一個迴歸模型,並選擇那些重要的迴歸模型?這將以任何可能的方式?我可以在JMP中進行線性迴歸,但我不確定我可以用R對所有變量進行非線性迴歸。因此,我正在手動嘗試查看是否可以預先查看哪些關聯了。如果有一個函數用於這個功能將會很有幫助。
'data'的結構是什麼?它是一個向量列表嗎?所有的矢量長度是否相同? –
它們的長度都一樣。我用 data = read.csv(「file」,header = TRUE)讀入它們。我認爲它必須處理標題,我改變了問題以反映工作代碼。 – dorien
如果'data'是'data.frame',那麼'data [1]'給你一個'data.frame'列,而'lm'需要一個向量。使用'data [[1]]來獲得向量。 – snaut