2011-05-17 112 views
1

我有一個觀察表(x,y),需要估計更接近它們的泊松分佈的均值。看來R和Octave都可以​​在Linux上做到這一點,但我想知道是否有多平臺的方式來做到這一點。我可以將任何東西與程序捆綁在一起,但我不能要求安裝任何東西來運行它。泊松分佈的極大似然估計?

我試圖尋找一種算法來自己做,並找不到一個,所以我不知道該怎麼做。

爲了記錄,我確實找到了一個簡單的算法來做到這一點,它基本上總結了所有的值併除以例子的數量,但即使是直接從書中取得的一個微不足道的例子也是如此。

實施例:

requisitions per day : absolute frequency (days) : relative frequency 
8 : 2 : 0.016 
9 : 4 : 0.033 
10 : 6 : 0.050 
11 : 8 : 0.066 
12 : 10 : 0.083 
13 : 12 : 0.100 
14 : 13 : 0.108 
15 : 14 : 0.116 
16 : 12 : 0.100 
17 : 10 : 0.083 
18 : 9 : 0.075 
19 : 7 : 0.058 
20 : 5 : 0.041 
21 : 3 : 0.025 
22 : 2 : 0.016 
23 : 2 : 0.016 
24 : 1 : 0.008 

爲泊松分佈的平均應爲15(根據書這裏也有我的例子)。我上面提到的方法和答案之一給出了16個。使用歐式距離的平方和我還發現,平均值爲15的泊松比平均值爲16的泊松更接近數據。

+0

這個問題寫得不好。我們需要一些更清晰的數據。爲什麼你有*對數據?這個問題的一個典型數據集就是數據的一個向量。 – 2011-05-17 00:53:19

+0

我有每天的申請數量和相關的頻率。但我可以通過將每天申請的絕對頻率除以相對頻率。 – dmpl 2011-05-17 01:01:10

+0

感謝您的快速響應,但我必須承認我仍然不確定。對我而言,「頻率」聽起來與「每天請購單」相同。我不知道你在做什麼「請購單」。是否有可以提供給我們的樣本數據?這將非常有幫助。 – 2011-05-17 01:10:02

回答

4

平均值的MLE只是樣本的意思。見維基百科:

http://en.wikipedia.org/wiki/Poisson_distribution#Maximum_likelihood

只是平均數據的載體。

更新:我現在基於剛添加到問題中的示例數據擴展此答案。

我的樣本數據的解釋是,

reqs-per-day frequency 
8    2 
9    4 
10    6 

意味着有兩個天凡的每一天徵用數爲8四天,其中徵用數爲9。因此,我將承擔該數據相當於:

8,8,9,9,9,9,10,10,10,10,10,10,... 

其中此列表中的每個條目對應於一天。這個列表的順序並不重要。我認爲你應該平均這個名單。

您的頻率字段的總數爲120.我認爲這意味着實驗中共有120天。

+0

我提到的列表將包含120個條目。我認爲這份名單的總數是1802.而1802/120大約是15.02。我認爲這是你期望的15的答案。 – 2011-05-17 02:19:17