2013-12-14 57 views
2

我已經通過大量的文獻看網上,包括這個論壇沒有任何運氣,希望有人能幫助我目前面臨的統計問題:總體排名位列名單

我的排名5所列出數據,每個數據包含從位置1(最佳)到位置10(最差)的10個項目。爲了上下文的緣故,每個列表中的10個項目是相同的,但是排序順序不同,因爲用於確定其排名的技術是不同的。

*實施例的數據: 列表1名列表2表3 ...等

項目1中排名中排名1 2 1排名

項目2排名中排名3 1 2排名

項目3中排名2排名3排名3

...等*

我正在尋找一種方式來解釋和分析上述數據,使我得到的最終結果顯示了每個項目的總體排名,基於每個測試及其位置,例如,

結果

等級1 =項目1

等級2 =項目3

等級3 = 4項

...等

有誰知道我怎麼能以統計上合理的方法(在研究生/博士適用水平)解讀這些數據,以便我能夠理解指示每個項目重要性的整體等級在5個測試列表中嗎?或者,如果有另一種類型的技術或統計測試,我可以看看,我會很感激任何提示或指導。 (也可能值得注意的是,我也執行了簡單的數學技巧,例如總和,平均,最小 - 最大測試等,但不覺得這些在統計上足夠重要)。

任何幫助或建議將不勝感激,謝謝你的時間。

回答

0

許多非參數統計測試通過將接收到的數據轉換爲等級,然後分析等級(如果數據離正常分佈很遠,這可以使生活更輕鬆)。如果您的等級是從某些基礎分數或善良得出的,並且您無法直接觀察,那麼您可以應用這些測試中的任何一項 - 在http://en.wikipedia.org/wiki/Ranking#Ranking_in_statistics有一個簡短列表或任何有關非參數統計的書籍,如Conover,應該涵蓋他們。

如果您可以想出您感興趣的統計數據,例如任何一個項目的總排名,您可以使用排列測試 - http://en.wikipedia.org/wiki/Resampling_%28statistics%29#Permutation_tests來計算相關統計數據的可能性至少與在所有排名都是隨機的概率下觀察,您只需生成零假設後的數據負載,並查看隨機生成數據中的統計分佈。然後你可以用它來得到一個P-值,或者更好的是一個置信度。

1
  1. 您可以使用機器學習來獲得您的排名列表。在信息檢索研究領域 - 這被稱爲Learning to Rank - 關於它的文獻有很多。 This tutorial(擡頭:高級教程)可以幫助你瞭解基本概念,並指導你深化文章。

  2. 你可能也想看看interleaved ranking。這最初是爲兩個清單的評估而設計的,但它可能對您的情況也有好處。