2012-11-09 129 views
1

可能重複:
Seeing if data is normally distributed in RR中的正態性測試給出了奇怪的結果?

我有6套殘差(FIT - 模型),我正態檢驗(我想證明,從模型的偏差在器樂噪音之內)。

它們的核心密度圖大致看起來是高斯的,並且qqnorm圖很好看。我已經通過兩個正常性測試運行了所有這些測試:shapiro.test {base}和ad.test {nortest}。這些測試顯示所有數據集都是正常的(p >> 0.05,接受正態性的零假設),除了一個。通常我不會質疑這些結果,但是迴歸爲「不正常」的測試(p<,0.05,拒絕零假設的正態性)來自看起來最高斯的數據集......我很困惑,並且會感謝任何幫助!

Here是我的剩餘核密度圖的矩陣,其中記錄了來自Anderson-Darling正態性檢驗(ad.test)的p值。所有圖表的尺寸都相同(x & y)。非正常特性是用紅色標記的CvsD圖。

Here is a link to the data for the CvsD comparison.

爲什麼不是這些殘差正常!?

+0

我不認爲這是重複的,因爲他問的是這些測試產生的特定問題。對於正常性 - 抱歉地得到所有的哲學,但與正常性測試一樣,計算機仍然遠不及人類大腦空間分析的力量。使用'cuts'和'plot(CD_resids)'來查看可能存在的偏斜,並將其與'rnorm'進行比較,隨機產生328個樣本大小。 –

+0

CvsD比較的_n_是否可能比其他組更高?如果是這樣,那麼較低的p值可能只是一種人造物,參見圖1。 @迪文的評論。 –

+0

爲了測試正態性,您應該使用Shapiro Wilk Test'shapiro.test(x)'in R. –

回答

1

事實上,這對我來說看起來並不算高斯,更像是一個大n的t分佈 - 它比正常曲線更「尖銳」。 ad.test shapiro測試返回p < 0.05(您的數據返回shapiro.test返回p = 0.002655)。

但是,請注意,正常性測試的有用性是有爭議的;例如參見this question。基本上,對於較大的樣本量,即使與正態分佈的小偏差也會受到懲罰,並且H0被拒絕。

這就是說,我仍然相信 - 因爲你只有328個樣本大小 - 在你的情況下,分佈是不正常的。

+2

具有大n的t分佈與正態分佈實際上沒有區別,特別是僅僅通過視覺區分。而不管它或多或少的「尖刺」只取決於正態分佈的方差。 – Fojtasek

相關問題