2017-05-04 87 views
0

好日子,如何使用箱線圖

我使用boxplot從我的數據集刪除離羣應用數據集上產生的去除異常值:

outliers <- boxplot(dataset, outline=FALSE); 

現在,作爲異常值變量的所有信息,如何我是否將刪除應用於數據集? boxplot做到了嗎?

謝謝

+1

請參閱離羣值通常是如何計算的:什麼是異常區的數據(http://www.itl.nist.gov/div898/handbook/prc/section1/prc16.htm) –

回答

1

boxplot認爲將異常存儲在outliers$out值。因此,假設您dataset包含在一個名爲value列值,你可以像這樣刪除:

dataset[!dataset$value %in% outliers$out, ] 

,或者如果dataset只有一個列:

dataset[!dataset$value %in% outliers$out, , drop = FALSE] 
0

可以利用這一點 -

x[!x %in% boxplot.stats(x)$out]