2012-11-16 113 views
2

我試圖適應的 累積分佈的雙對數圖網絡,以三種模式之一:指數(P(k)~e^(-ak)), 指數截斷的冪律(P(k)~k^(a-1)e^(k/kc))和電力 法律(P(k)~k^-a)。我知道這是一個低的信息考驗,但我 只是想確定三個車型是最適合 (或者可能是最可怕的配合!)軟件計算AIC的功法,指數和指數截斷冪

我在與logCPK一個Excel工作表(列B)和三個模型(列C,D和E)的擬合值。我還有 也計算了三個模型(列G,H, 和I)的總平方和(SST)(列F),然後計算了誤差平方和(SSE)。

對於三個模型,我然後計算1-(sum(SSE)/sum(SST)) 來估計一個簡單的線性迴歸的R^2值的每 模型,其在黃色在Excel中 表的底部突出。所以,現在我有三個R^2值(冪律= 0.507,指數 = 0.777,指數截斷冪律= 0.899)。首先,似乎指數截斷的冪律具有最佳的擬合(最高的R^2值)。但是,我不知道該如何解釋 懲罰,該指數截斷冪有 度的2自由的事實,而其他兩款車型有度 自由1.

的時候我在網上接觸的另一個統計源,我被告知我應該 使用「似然比測試」。從我所瞭解的情況來看, 最適合其「對數似然性」的負值最小。 但是,指數截斷冪律最初似乎具有其「對數似然性」的最小負值(因爲它有兩個 df,而另外兩個模型只有一個df),所以我必須測試 在考慮 自由度之後它是否確實保持較低的負值。

認爲我知道如何從理論上計算一部分,在Excel中:

1)使用CHIDIST(A,B),其中A是

2*(log.likelihood of Exponentially 
truncated - log.likelihood of Power law) 

和B的區別在df (2-1 = 1)中。如果p值小於0.05,那麼指數級 確實比Power定律更適合。 2)使用CHIDIST(A,B)其中A是

2*(log.likelihood of Exponentially 
truncated - log.likelihood of Exponential) 

和B是 DF(2-1 = 1)的差值。如果p值小於0.05,那麼指數式 截斷的確比擬指數更適合。

然後我可以得出結論哪個模型是最合適的。

這就是我的問題所在(取決於我的想法 以上是否正確),如何計算 日誌(可能性)?我搜查了,但我仍然在迷路。這似乎是 ,這個手工計算是一個野獸(除非我可以簡單地使用我已經在Excel中已有的 ),所以我也在問關於軟件。

另一種方法是計算AIC(也有人對我來說),但 我相信我仍然有同樣的問題,在這裏我需要計算 日誌(可能性)爲AIC方程(AIC = 2k - 2ln(L))

所以我的具體問題是如何直接從我在Excel中使用或使用 軟件來計算三種模型的AIC和/或日誌(可能性) 。

預先感謝您!

PS:我已經看過成R編程,看看它有一個AI {統計}和 logLik {統計}功能,但我不從文檔 明白我是否擁有所有必要的輸入信息來運行這些功能, ,如果是的話,如何運行它。

回答

0

對於冪律,你可以使用給出的公式和指導方針:

Newman MEJ (2005) Power laws, Pareto distributions and Zipf’s law. 
Contemporary Physics 46: 323–351. doi:10.1080/00107510500052444. 

或也

Xiao X, White E, Hooten M, Durham S (2011) On the use of log-transformation vs. 
nonlinear regression for analyzing biological power-laws. Ecology 92: 1887–1894. 
doi:10.1890/11-0538.1. 

他們與R中

,後碼在線附錄你會對如何與其他發行版做一個更深入的瞭解。