計算t統計量使用`scipy.stats`

2015-02-09 151 views 1 likes

我有值的兩個樣本，兩種不同的條件下，對同一組測量：計算t統計量使用`scipy.stats`

import numpy as np 
import scipy.stats as st 

v1 = np.array([ 152.65285 , 97.011475, 77.56722 , 120.19234 ]) 
v2 = np.array([ 149.19984, 172.08975, 143.92285, 108.60255])

我想要做的就是在這個特別的數據集執行dependent t-test for paired examples 。如在維基百科鏈路所看到的，這是通過使用下面的公式計算所述噸值來執行：

enter image description here

凡mu_0設置爲0。我執行該計算和計算出，T_VALUE等於

>>> (np.average(v1 - v2) * np.sqrt(len(v1)))/(np.std(v1 - v2)) 
-1.6061552162815307

但是，使用scipy.stats包，我得到一個稍微不同的結果：

>>> st.ttest_rel(v1,v2) 
(-1.3909712197206947, 0.25844779134312651)

第一數st.ttest_rel(v1,v2)返回應，根據scipymanual，等於噸 - 值，但它不。我在這裏錯過了什麼，或者是scipy.stats錯誤地計算統計信息？

來源

2015-02-09 5xum

回答

的差異似乎是np.std計算與N自由度的標準偏差，而ttest_rel使用偏估計來計算的話（N-1自由度）。

可以通過指定爲1在np.std在自由度的差異解決這個問題：

>>> (np.average(v1 - v2) * np.sqrt(len(v1)))/(np.std(v1 - v2, ddof=1)) 
-1.3909712197206947

兩個計算然後同意。

來源

2015-02-09 09:57:05

啊，當然。標準差的自由度。謝謝你指出我。接受答案。 – 5xum 2015-02-09 10:08:30

我在我的python文件夾的site-packages目錄中查看了scipy的源代碼。在文件scipy/stats/stats.py中顯示瞭如何計算ttest_rel。我發現它的做法與手動計算的案例有點不同。但是因爲我不是統計專家，所以你可能想看看你自己的實現。這是最好的提示，我可以在瞬間給...

來源

2015-02-09 09:49:05 WWhisperer

你是對的，ajcr的回答也解釋了爲什麼ttest是正確的，我的方法不正確。 – 5xum 2015-02-09 10:09:02

相關問題

1. 使用計算的統計量在ggplot2 boxplot中排序x軸使用計算的統計量
2. 計算箱數量T-SQL
3. 統計計算
4. 統計計算
5. 計算t-inverse
6. 計算卡方統計量中的R
7. 計算CPU使用率統計
8. 使用awk計算統計信息
9. 計算使用統計::迴歸
10. Gearman - 計算統計

11. 收集表統計和計算統計
12. 獲取t統計量的Python函數
13. 如果我有t統計量和d.f.，我如何計算p值？（在Perl中）？
14. 的Javascript統計計算器
15. 計算統計表格
16. 計算/繪製統計
17. 計算月份統計
18. 年級統計計算器
19. 計算彙總統計
20. 統計估計算法
21. 計算彙總統計
22. R：統計/計算效率
23. 如何使用rollapply訪問t統計量和p值？
24. 如何使用R來計算高階統計量中的四階累積量？
25. 計算流量統計的計費週期
26. 使用QScriptEngine計算計算
27. 計算使用CSS計算（）
28. 使用T-SQL計算以前記錄的數量
29. 用戶統計：「interative calculation」或批量計算+高速緩存
30. 是否有任何API用於統計計算，例如查找T值？