2013-03-09 37 views
0

這必須是一個相當標準的問題:我有一些有錯誤的返回數據(它們是實際的錯誤,而不僅僅是大的回報)。我正在考慮糾正這個問題的最好方法,以免影響我的迴歸。一個想法是簡單地設置極端分位數的回報來表示回報。另一種解決方案:有lm忽略這些極端值。 lm中是否有內置的方法可以忽略極端值?我知道matlab有一個叫做粗糙迴歸的東西,就是這樣做的。健壯到異常值lm在R

+1

[CRAN任務視圖](http://cran.r-project.org/web/views/Robust.html)強大的統計方法應該讓你開始。 – 2013-03-09 04:50:14

+0

魯棒性不一定意味着去除異常值,但也可能基於不容易受其影響的估計量(最平凡的均值vs中值)。因此,我看到那裏沒有重複。 – Thilo 2013-03-09 12:56:19

回答

4

lm是否有內置的方式使其忽略極端值?

是的。你需要看看rlm。請致電CRAN Task for robust methods。 (喬什已經給出了這個鏈接)

+0

下面是一個穩健迴歸的例子http://r-statistics.co/Robust-Regression-With-R.html – Selva 2016-01-01 17:33:40