2016-09-20 13 views
-3

我正在學習機器學習,我正在閱讀有關參考鏈接之一的R中的MICE包。但有一點觸動。我需要一個能夠在這個時候幫助的人。exp = lm(Sepal.Width〜Sepal.Length + Petal.Width)這是什麼意思?

這是代碼,我缺少Iris.mis數據框中的Sepal.Length,Sepal.width,Petal.Length,Petal.width中的值。

所以作者編碼如下。

imputed_Data <- mice(iris.mis, m=5, maxit = 50, method = 'pmm', seed = 500) 

我們得到5個完整的數據集,如m = 5所述。接下來是功能,爲了組合5個數據集。所以,

fit <- with(data = iris.mis, exp = lm(Sepal.Width ~ Sepal.Length + Petal.Width)) 

所以,只是想到底什麼是 「EXP = LM(Sepal.Width〜Sepal.Length + Petal.Width))」

我明白了,作者是用線性迴歸的LM,但是這裏迴歸的目的是什麼?他爲什麼這樣做?

感謝。

+0

如果你只是作者的意圖有趣,那麼你應該問他們。這對於其他人猜測的奇怪之處在於。 – MrFlick

+0

我明白,這不是很多的編程,我曾在該網站發佈。我沒有得到任何評論。所以爲了清除我的疑惑,我以此爲平臺。我想明白,他們到底在幹什麼。 – subro

回答

2

閱讀help("with")。有一個參數expr(它需要一個表達式)。 R允許函數參數的部分名稱匹配。因此,expexpr參數匹配。

這真是一個令人費解的選擇,更好的fit <- lm(Sepal.Width ~ Sepal.Length + Petal.Width, data = iris.mis)

+0

感謝您的評論,但爲什麼作者僅將Sepal.width作爲獨立參數,並將Sepal.Length和Petal.Width作爲獨立參數?爲什麼他不考慮Petal.Length?任何猜測,他爲什麼要線性迴歸?再次感謝。 – subro

+0

他們只是表明你可以在插補後做線性迴歸。在插補之後你打算對數據集進行的處理對你來說很重要,但通常你會使用某種統計模型。 – Roland