2013-08-05 63 views
1

我有一個數據集並希望在一端丟棄1%的數據。例如,我有3000個觀測值,我想放棄30個最高值。有沒有這種修剪的命令?順便說一句,我是Stata新手。在Stata中修剪數據

+0

只是爲了指出什麼應該是顯而易見的:許多統計人員認爲這種數據丟失是一個壞主意。一個相關但不同的點是,這不是在例如修剪手段,其中極值被忽略,但不被刪除。 'trimmean'(SSC)是用戶編寫的Stata實現。 –

回答

1

您可以在Stata中使用_pctile

sysuse auto, clear 
_pctile weight, nq(100) 
return list #this is optional 
drop if weight>r(r99) #top 1 percent 
1

如果你知道你可以使用什麼截止是你降:

drop if var1>300 

其下降與var1超過300

您可以使用summarize var1, detail拿到鑰匙百分所有行:它會給你1%和99%的百分點以及其他標準百分位數。

0

要在Stata選擇30個觀測,請使用以下命令:

keep if (_n<=30) 

爲了跌幅居前30的意見在Stata,請使用以下命令

keep if (_n>30) 
+0

這是一個誤導,作爲一個答案,沒有解釋說你必須先排序並分別處理缺失的值。 –