2012-12-03 28 views
3

我試圖用R對我擁有的某些數據進行泊松迴歸。目前的數據結構如下:如何構造Poisson迴歸的分層數據

數據根據三個職業分層。數據中有四個收入水平。在每個階層,收入的每一級有

  1. 發生的工傷事故的數量,並
  2. 觀察到的總人月。

下面是一個設置示例。括號內的數字是觀察到的總人數月數,不在括號內的數字是工作場所事故的數量。

http://i45.tinypic.com/4kwnp.png

我的問題是我怎麼建立這個數據和收入水平的工作場所事故的發生效果進行泊松迴歸?理想情況下,我想調整職業,找出收入的影響,但作爲一個起點,我不確定如何將其設置爲泊松迴歸問題。我考慮過在觀察的幾個月內將受傷的人數分開,但這樣做會給出非整數值,所以我認爲這不是正確的做法。

重申,預測:收入水平;響應變量:工作場所事故。

順便說一下,將括號分開並將它們放入自己的列中非常容易,如果這樣做有意義的話。

我真的很感激任何關於如何設置的建議。我相信其他統計人員正在處理類似結構化的數據,並希望獲得一些見解。非常感謝!

+4

兩條評論:我認爲這個問題可能更適合統計參數t http://stats.stackexchange.com/此外,發佈數據作爲圖像對於那些想要幫助的人來說幾乎是無用的。作爲文本進行復制和粘貼(或者理想的是,將數據以R格式輸入)將會更加有益。 – thelatemail

回答

3

@thelatemail可能是正確的認爲這是更適合stats.stackexchange.com,但這裏有一些R代碼。該數據格式很寬,需要將其重新組織爲長格式。 (你不希望包含總計列,在將前四列轉換爲一個長格式,其中你有'職業'和'級別'作爲因子分類變量,事故'計數'和'數字'作爲數字列,你可以使用這個調用來glm

fit <- glm(counts ~ level + occup + offset(log(months)), data=dfrm, family="poisson") 

偏移需要被記錄() - ED與由泊松家族默認鏈接功能創建的登錄數同意

(你真的不能指望我們重做數據錄入任務,現在可以嗎?)

+1

+ 1太快了(也許我不應該去喝杯咖啡的答案) – mnel

+0

謝謝,這是非常有幫助的!!而且我很抱歉發佈在堆棧交換的錯誤部分 - 我是一個新手用戶,但我一定要確保下次再做。 – bogenton

+0

測試的方法是:if((theory.content-code.content)/total.content> 0.5){stats.stackexchange} else {stackoverflow}'...並且不要忘記先搜索。 –