我正在處理大量的由異常值組成的數據。該代碼適用於大多數數據集,但幾乎不適用。幾個異常值沒有刪除
該樣本數據:
set.seed(100)
m=rnorm(200)
m[1]=100 #inserting outlier
m[2]=50
我的代碼是:
library(outliers)
lg=outlier(m, logical=TRUE)
for(i in 1:length(lg)){
if(lg[i]==c("TRUE")){
m[i]=NA }}
這將替換離羣值來港定居。 現在在這種情況下,100個被移除,但50個未被移除。 我的數據集也在發生同樣的事情。我無法弄清楚爲什麼。 我希望在此獲得幫助。
謝謝您的閱讀。
如何定義「異常值」?它不是基地R,AFAIK。 – Andrie
它在異常值包。 退房嗎?離羣值 – rockswap
沒問題。我已經補充說。 – rockswap