0
好日子,如何使用箱線圖
我使用boxplot
從我的數據集刪除離羣應用數據集上產生的去除異常值:
outliers <- boxplot(dataset, outline=FALSE);
現在,作爲異常值變量的所有信息,如何我是否將刪除應用於數據集? boxplot
做到了嗎?
謝謝
好日子,如何使用箱線圖
我使用boxplot
從我的數據集刪除離羣應用數據集上產生的去除異常值:
outliers <- boxplot(dataset, outline=FALSE);
現在,作爲異常值變量的所有信息,如何我是否將刪除應用於數據集? boxplot
做到了嗎?
謝謝
是boxplot
認爲將異常存儲在outliers$out
值。因此,假設您dataset
包含在一個名爲value
列值,你可以像這樣刪除:
dataset[!dataset$value %in% outliers$out, ]
,或者如果dataset
只有一個列:
dataset[!dataset$value %in% outliers$out, , drop = FALSE]
可以利用這一點 -
x[!x %in% boxplot.stats(x)$out]
請參閱離羣值通常是如何計算的:什麼是異常區的數據(http://www.itl.nist.gov/div898/handbook/prc/section1/prc16.htm) –