2013-06-18 30 views
0

在我的格子直方圖:在點陣直方圖中如何只保留99%的數據?

histogram(~bill|group,data=mydat,type='count',nint=50,layout=c(9,3)) 

如何將各組內第99百分位前保持「條例」的數據?

+0

這很不清楚。 「保持」是什麼意思? – joran

+0

如果數據非常偏斜,您可以將'scales = list(x = list(log = 2))'添加到'直方圖'的參數中,作爲消除數據的潛在替代方法。 – BenBarnes

+0

@joran Keep要保留,其他(最後1%)將被修剪。 – kostia

回答

1

您可能希望從整個帳單數據中刪除異常值。首先將數據複製到一個新的變量

mydat$bill.cleaned=mydat$bill 

然後設置較大的值丟失

cuttoff= qnorm(.99,mean(mydat$bill),sd(mydat$bill)) 
    mydat$bill.cleaned[which(mydat$bill > cuttoff)]=NA 

然後你就可以顯示你清理的數據的直方圖。

或者,如果您只想刪除每個組內的外圍。你需要使用額外的應用語句來完成與上面相同的事情。

+0

謝謝@Seth!我後來也找到類似的解決方案,像這樣:http://stackoverflow.com/a/4788102/2078985 – kostia

+0

如何「做一個額外的申請聲明與上述相同的事情」?我搜索了一段時間,但找不到解決方案。 – kostia

+0

我使用ave解決了問題(從另一篇文章中學到)。謝謝! – kostia