我正在尋找一個宏或SAS中的某些東西,可以幫助我隔離數據集中的異常值。我將異常值定義爲:上限:Q3 + 1.5(IQR)下限:Q1-1.5(IQR)。我有以下SAS代碼:SAS刪除異常值
title 'Fall 2015';
proc univariate data = fall2015 freq;
var enrollment_count;
histogram enrollment_count/vscale = percent vaxis = 0 to 50 by 5 midpoints = 0 to 300 by 5;
inset n mean std max min range/position = ne;
run;
我想擺脫fall2015數據集的異常值。我發現了一些宏,但沒有運行宏。有幾個有我沒有的類變量。任何想法如何分離我的數據?
沒有異常值的標準定義。你需要定義你的規則,然後你可以過濾出觀察結果。什麼是異常值,這個問題可能屬於stats.stackexchange.com – Reeza
很酷。我正在尋找一個簡單的宏,它可以根據這個定義找到以下異常值:上限:Q3 + 1.5(IQR)下限:Q1-1.5(IQR)。 – cylurian
你可以在這裏修改代碼,但它不是一個有效的方法。 https://gist.github.com/statgeek/31316a678433a1db8136 – Reeza