2014-10-27 28 views
2

我有一個面板數據集,每兩年在2004年至2010年期間隨着時間的推移對醫院進行跟蹤。數據在Stata中,但是我將它帶到R.最初,變量year(2004,2006,2008,2010)和t(1 = 2004,2 = 2006等)是整數,但後來我將它們轉換爲因子爲如下:年份變量應該是R中面板數據中的因子還是數值?

data$year <- factor(data$year) 

並且對於t時間變量也是類似的。

但我很困惑,我的問題是,是否將yeart作爲整數或數字變量或將其轉換爲面板數據的因子以及上述命令是否是轉換爲因子的正確方法?

+0

一般來說,它應該是一個因素,如果它是一個分類變量。 – 2014-10-27 03:57:03

+1

如果這是面板(縱向)數據,那麼'year'和't'都是代表時間流逝的數字變量,所以我會認爲它們應該保持數字而不是因子,特別是如果您正在運行數據通過重複測量回歸模型。 – eipi10 2014-10-27 05:54:28

回答

1

作爲一個分類變量處理year將計算每個個人年份的影響 - 即在給定年份中對目標變量的平均影響。另一方面,包括t作爲數字變量說明平均兩年後會發生什麼。鑑於只有4個時間段,第一種方法似乎更合理,但它確實取決於我們分析的目標。

的命令應該是

data$year <- as.factor(data$year)

此外,請確保您只包含yeart之一,因爲兩者都可能導致解釋錯誤。

+0

對不起,遲到的回覆,但謝謝。最後,由於它是一個簡短的小組,我們把年份當作一個分類變量。 – user3571389 2015-09-18 17:28:39

相關問題