2016-03-01 43 views
0

從擁有10種鳥類的種羣中抽取1000只鳥類,預期結果是每種類型的100只鳥類(這是爲了簡單起見;一般情況下每個分佈的概率Pi都是i = 1。 ..10)。比較兩個樣本的測試

現在我已經編寫的計算機程序,以與每種類型以相同的概率(或概率Pi其中,i = 1 ... 10在一般情況下)

讓的說預期結果隨機抽樣1000號(讀鳥類)是E,在任何程序運行期間,觀察到的結果都是S.現在爲這個程序編寫一個單元測試用例,我進行了卡方檢驗來比較S和E,並斷言Chi-統計量的p值大於0.05。我已經在循環中聲明瞭這個n(比如100)次。

期望n個p值中的每一個都大於0.05是不正確的。因此,斷言「平均」n個p值大於0.05是一個好主意。

更一般地說,這裏設計測試的正確方法是什麼。

+0

我投票結束這個問題作爲題外話,因爲它不是關於編程。 –

回答

0

你對我的問題並不完全清楚,但我沒有足夠高的聲望發表評論澄清,所以我會盡我所能,把我的最好的一擊。你必須記住的是,p值是一個條件概率。具體來說,觀察結果的概率至少與我們所看到的零假設爲真的結果一樣極端。

在您的模擬中,您已強制null爲真(預期結果與您測試的聲明相同:每種類型有100只鳥)。在零假設下,p值具有均勻分佈,因此模擬的平均p值在理論上將爲0.5。

+0

你的解釋是正確的。但是我的問題是理論預期的p值大於0.05並不意味着每個p值的結果是0.05。那麼以上情況下最好的測試是什麼? – Gerry