2014-09-29 114 views
1

我在KhanAcademy.com上關於框圖的例子。R彙總功能

我試圖模擬問題中的R用下面的代碼

x <- c(13,9,11,8,8,12,9,9,4,12,10,8,11) 
summary(x) 
Min. 1st Qu. Median Mean 3rd Qu. Max. 
4.000 8.000 9.000 9.538 11.000 13.000 

KA的薩爾指出,有越來越在正中一個因素是否計算1時區別在於四對兩種方式和第三四分位數。

有沒有辦法在計算其他四分位數時告訴您要排除中位數的彙總函數。

如果這種方法被認爲是

Min. 1st Qu. Median Mean 3rd Qu. Max. 
4.000 8.000 9.000 9.538 *11.500* 13.000 

怎麼會沒有就如何解決這些問題的方法一致的答案?

+3

這 - http://chemicalstatistician.wordpress.com/2013/08/12/exploratory-data-analysis-the-5-number-summary-two-different-methods-in-r-2/ - 有一個關於'summary','fivenum'和'quantile'函數之間的區別可能會對您有所幫助。 ''quantile'還解釋了(有點)你的'爲什麼'的問題,儘管這個問題應該在[交叉驗證](http://stats.stackexchange.com/) – hrbrmstr 2014-09-29 10:16:49

回答

1

實際上有9種類型的quantile可在R請參閱?quantile欲瞭解更多信息如何定義,哪些統計軟件實現哪些,併爲他們的推導的參考。你都可以看到他們在這裏:

t(sapply(1:9, function(y) quantile(x,type=y))) 
     0% 25% 50%  75% 100% 
[1,] 4 8 9 11.00000 13 
[2,] 4 8 9 11.00000 13 
[3,] 4 8 9 11.00000 13 
[4,] 4 8 9 11.00000 13 
[5,] 4 8 9 11.25000 13 
[6,] 4 8 9 11.50000 13 
[7,] 4 8 9 11.00000 13 
[8,] 4 8 9 11.33333 13 
[9,] 4 8 9 11.31250 13 

正如你會發現,你的數據只有在第三個四分位數的變化。 R的默認值是類型7,這就是你將從summary得到的結果。