2013-07-16 71 views
0

我有一個包含與我們合作的所有供應商的升學率的數據集。我需要將這些數據分成四分位數,以便每個提供商可以看到他們的費率與其他提供商相比較。率在7%到89%之間。任何人都可以建議我如何做到這一點?我不確定這是否是問這個問題的正確的地方,但如果有人能夠幫助我,我會非常感激。將數據分成四分位數

另一個問題是,如果提供者的數字非常小,例如:2/4 = 50%,則提供者可能會陷入更差的四分位數,但這並不意味着提供者的表現不好,因爲數字太小。我希望這是有道理的。請讓我知道,如果我可以進一步澄清。

回答

0

首先關注:對於小ñ,不使用四分。 n是否小是任意的。

0

有辦法獲得位數沒有做一個完整的排序,但除非你有大量的數據,沒有點在執行這些算法,如果你還沒有得到他們提供。假設你有一個sort()功能,所有你需要做的是:

  1. 鑑於ň數據點。
  2. 排序的數據點。
  3. 查找排序的數據n/4n/23*n/4個百分點,這是你的分位數。

正如你所說,如果ñ小於一定數量(即你必須爲你自己決定),你可能想說的是,四分之一的結果是「不適用」或一些這樣的。

+1

排序數據*上升*,否則解釋是沒有意義的。 – Jefftopia

+0

謝謝大家的迴應。我會嘗試你的建議。 @Jefftopia - 如果一個小的n不應該被認爲是四分位數,那麼一個小的n會在哪裏呢? – datacentric

+0

我認爲你的問題的答案取決於你想完成什麼。一般來說,我建議不要使用四分位數,因爲它們不能最好地捕獲關於數字分佈的重要信息。對於小'n',我想我會在@ Simon的帖子中的第2步中停止。 – Jefftopia