2016-08-12 120 views
-3

我嘗試刪除潛在的異常值R. 我的問題來刪除一個龐大的數據庫的潛在異常是下一個: https://www.photobox.co.uk/my/photo/full?photo_id=9286177980嘗試使用R.

當我申請的箱線圖,我newdata得到了更多潛在的異常值比原始數據。林與500.000觀測工作,所以我需要解決這個正確地做到我的分析。

我知道,當分佈是不均勻的,像這樣的情況下,我們可以用第二個和第三個四分位數的工作,但如果我這樣做,我失去我的數據的20-30%。

謝謝。

+4

鏈接被重定向到主站點。 (https://www.photobox.co.uk/a/) – zx8754

回答

1

刪除異常堅實的辦法是放棄這比平均值+ 2或(在你的情況下,如果你不想刪除的條目太多)放大所有條目3點標準差(即> M + 3SD) 。