從擁有10種鳥類的種羣中抽取1000只鳥類,預期結果是每種類型的100只鳥類(這是爲了簡單起見;一般情況下每個分佈的概率Pi都是i = 1。 ..10)。比較兩個樣本的測試
現在我已經編寫的計算機程序,以與每種類型以相同的概率(或概率Pi其中,i = 1 ... 10在一般情況下)
讓的說預期結果隨機抽樣1000號(讀鳥類)是E,在任何程序運行期間,觀察到的結果都是S.現在爲這個程序編寫一個單元測試用例,我進行了卡方檢驗來比較S和E,並斷言Chi-統計量的p值大於0.05。我已經在循環中聲明瞭這個n(比如100)次。
期望n個p值中的每一個都大於0.05是不正確的。因此,斷言「平均」n個p值大於0.05是一個好主意。
更一般地說,這裏設計測試的正確方法是什麼。
我投票結束這個問題作爲題外話,因爲它不是關於編程。 –