2
我有這樣的功能:如何爲因子變量的每個級別應用函數?
remove_outliers<-function(x){
qnt<- quantile(x,probs=0.99)
y<- x
y[x>qnt]<- NA
y}
目的是去除處於數據的前1%(代替它們與NA值)離羣值。我如何在一個因子變量的層次上應用此功能?
例如,
與組A和B的原始數據集:
group share
A 100
A 50
A 30
A 10
... ...
B 100
B 90
B 80
B 60
... ...
應該結束了這樣的:
group share
A NA
A 50
A 30
A 10
... ...
B NA
B 90
B 80
B 60
... ...
我已經通過,tapply,sapply,但嘗試過這些都會改變數據集輸出的結構。
對不起,我沒有用大寫樂趣。謝謝! – kostia