這裏是我的代碼和繪圖結果,由於某些異常值,x軸很長。有沒有一個簡單的方法,我可以篩選df$foo
R只有0-90%或0-95%的百分點,這樣我可以只繪製正常值?謝謝。只顯示0-90%或0-95%百分位數
df <- read.csv('~/Downloads/foo.tsv', sep='\t', header=F, stringsAsFactors=FALSE)
names(df) <- c('a', 'foo', 'goo')
df$foo <- as.numeric(df$foo)
goodValue <- df$foo
summary(goodValue)
hist(goodValue,main="Distribution",xlab="foo",breaks=20)
感謝華納的想法和投票。我認爲你的解決方案只適用於正常分配?對於任何其他發行版,任何解決方案?順便說一句,我想我可以寫一個函數來計算任何一組數據(即可以是任何類型分佈)的90%百分位數,在這個問題中,我只是問是否有內置方法。 –
@ZheyuanLi,投票支持你的回覆。我知道分位數是什麼意思,我的意思是在代碼中,它使用'rnorm',我認爲它基於數據正態分佈的假設來計算分位數? –
@LinMa我使用'rnorm'來創建一些數據。無論分佈如何,「分位數」都可用於矢量。 @ZheyuanLi我同意你的短代碼版本。我只是說明如果選擇上限和下限,它會是什麼樣子。 – Warner