2012-06-12 37 views
0

我使用GAM模型根據給定點的某些環境條件來預測物種丰度。我創建了一個廣義相加模型(GAM)來做到這一點,並根據我的預測。然而,在模型方程中我有一個分類變量(沉積物 type = [1,2,3,4])。該方程似乎工作得很好,但 擬合的結果似乎吸收因子水平'1'進入截距。見下文。使用GAM適合的因子水平下降

任何人都可以解釋這個模型發生了什麼?我不完全明白。這是用mgcv包在R中運行的。謝謝!

Equation:    
abundance ~ s(x) + s(y) + s(z) + s(w) + factor(Sediment) 
Parametric coefficients: 
Estimate Std. Error z value Pr(>|z|) 

(Intercept) ------------_7.138 ----- 0.000 ------7541.26 2e-16 
     factor(Sediment)2 -0.2496868 0.0016749 -149.08 2e-16 
     factor(Sediment)3 -0.5128687 0.0058931 -87.03 2e-16 
     factor(Sediment)4 -0.1467369 0.0034606 -42.40 2e-16 

Approximate significance of smooth terms: 
       _________ _edf Ref.df Chi.sq p-value  
s(x) 3.983  4 69264 2e-16 
s(y) 3.998  4 1147536 2e-16 
s(z) 3.995  4 197458 2e-16 
s(w) 3.999  4 340085 2e-16 
+1

看來我無法投票將其作爲stats.stackexchange.com上的問題的重複來關閉。然而[there](http://stats.stackexchange.com/q/26539/5055)。 – joran

回答

4

截距表示沉積物類型1的平均丰度,因爲這將是參考水平(第一水平)。估算值是其他沉積物類型的係數,代表該類型與參考水平(沉積物類型1)的偏差。

這是一個在模型中帶有因子變量的標準約定;如果模型中有截距,則不能將其表示爲的每個因子級別,因爲模型矩陣的結果列將相互線性相關 - 您可以使用至少一列較少的列表示相同的信息在模型矩陣中。

如果需要,可以通過在公式中添加- 1來刪除截距,但我在這裏沒有看到這樣做的理由。

+0

雖然在公式中添加「-1」應該會導致更多的SO或SE問題。 –

+1

@DWin ???你的意思是在統計上解釋這樣一個模型?是的我同意;由於西蒙伍德制定的GAM上的所有可識別性約束條件,我只會選擇信任他並保持截取。 –

+0

我想這會引發更多關於R中對比的解釋的問題。我並沒有特別想到GAM的情況。 –