2016-12-28 29 views
0

我有一個數據集,在該數據集中需要對兩週內醫生的訪問次數作爲年齡組函數的變化進行泊松迴歸分析(即< 30 30至50歲,> 50歲),性別和疾病。控制性別和疾病的數量不變的平均值。在Poisson迴歸中創建預測函數

這裏是我的數據樣本:

visits gender age illness 
    1 female 19  1 
    1 female 19  1 
    1 male 19  3 
    1 male 19  1 
    1 male 19  2 
    1 female 19  5 
    1 female 19  4 
    1 female 19  3 
    1 female 19  2 
    1 male 19  1 

不過,我不知道如何去了解這個,因爲我不知道如何正確地輸入這些羣體。當我需要在兩週時間內爲不同年齡組別發現參觀的預測率就醫。

我知道如何輸入初始公式: GLM(訪問〜年齡+性別+生病,數據= DoctorVisits,家庭=泊松)

但我不知道我怎麼會去有關創建的預測功能。

+0

從使用'cut'在訓練數據中創建年齡組開始。 – Roland

+0

@Roland我會用哪些功能或操作者「30至50」的年齡組?謝謝您的幫助。 –

+0

我已經告訴你:'剪切'。研究它的文檔。 – Roland

回答

0

請說出您想預測男性21歲/ O和疾病= 3

predict(your_glm, 
newdata = data.frame(gender = "male", age = 21, illness = 3), 
type = "response") 

在這裏,你基本上創建與obseravations一個數據幀要用於該函數內的預測。如果你有一些意見想要的預測那麼它可能是更明智的單獨首先創建的數據幀,然後給它來預測功能,只是交換"newdata=""data="

type = "response"會給你在相同的格式GLM預測,否則將被記錄消耗臭氧層物質。