2015-04-25 31 views
0

我有兩個陣列,我想做一個皮爾遜的卡方測試(吻合度)。我想測試預期和觀察結果之間是否存在顯着差異。皮爾遜的卡方測試Python

observed = [11294, 11830, 10820, 12875] 
expected = [10749, 10940, 10271, 11937] 

我想比較11294與10749,11830與10940,10820與10271等

這裏就是我有

>>> from scipy.stats import chisquare 
>>> chisquare(f_obs=[11294, 11830, 10820, 12875],f_exp=[10749, 10940, 10271, 11937]) 
(203.08897607453906, 9.0718379533890424e-44) 

,其中203是卡方檢驗統計量和9.07 e-44是p值。我對結果感到困惑。 p值= 9.07e-44 < 0.05因此,我們拒絕零假設並得出觀察結果和預期結果之間存在顯着差異。這是不正確的,因爲數字非常接近。我該如何解決?

+2

我從p值表中獲得了較低的值,並且從mathematica中獲得了相同的答案。你得到的答案沒有錯。 –

+1

我認爲這是與[這個問題]相同的問題(http://stackoverflow.com/questions/20492419/python-scipy-chisquare-returns-different-values-than-r-chisquare)(只是問的方式不同):使用'chi2_contingency'來代替。 – Evert

+0

@Evert:這是*不是*同一個問題。在列聯表中,所有給定的頻率都是觀測到的頻率,預期的頻率是從觀測到的頻率中推斷出來的。在這裏的問題中,觀察到的和預期的頻率都給出了,所以它不是一個列聯表問題。 –

回答

0

一般而言,零假設(H0)表示,這兩個變量(X和Y)是獨立的,在X即變更值不會在Y.

例如,X = [1影響的值,2,3,4]和Y = [2,4,6,8]

如果你使用任何方法計算「p值」這種情況下,它應該是一個非常小這意味着這種情況在零假設之後存在的可能性非常低,即X和Y彼此獨立的可能性非常低。

這意味着它將永遠不會遵循這裏的空假設,並且這兩個變量相互依賴,形式爲Y = 2X。

在你的情況下,同樣的9.0718379533890424e-44 p值的得分手段同樣的事情,即較小的值表示有一個非常低的機會就足夠了原假設,這意味着觀察預計彼此相關,並且它們之間沒有獨立

詩篇。你對此是正確的。