我有一個包含幾個變量的大型數據集,其中一個是狀態變量,每個狀態編碼爲1-50。我想在數據集的其餘27個變量(總共有55個變量)上運行28個變量的迴歸,並針對每個狀態進行特定。R通過lapply命令從多元迴歸中提取回歸係數
換句話說,對於狀態== 1的觀察值,運行協變量1,協變量2,...,協變量27的變量1的迴歸。然後,我想對狀態2-50的變量1重複此操作,並重復變量2,變量3,...,變量28的整個過程。
我想我已經寫了正確的R代碼來做到這一點,但接下來我想要做的是提取係數,理想情況下,係數矩陣。有人能幫助我嗎?下面是我到目前爲止已經編寫的代碼:我已經清理你稍微代碼
for (num in 1:50) {
#PUF is the data set I'm using
#Subset the data by states
PUFnum <- subset(PUF, state==num)
#Attach data set with state specific data
attach(PUFnum)
#Run our prediction regression
#the variables class1 through e19700 are the 27 covariates I want to use
regression <- lapply(PUFnum, function(z) lm(z ~ class1+class2+class3+class4+class5+class6+class7+
xtot+e00200+e00300+e00600+e00900+e01000+p04470+e04800+
e09600+e07180+e07220+e07260+e06500+e10300+
e59720+e11900+e18425+e18450+e18500+e19700))
Beta <- lapply(regression, function(d) d<- coef(regression$d))
detach(PUFnum)
}