我想了解R.迴歸我試圖解決一個鍛鍊至極擁有100個隨機男女數據集是這樣的:迴歸中的R與分類變量
sex sbp bmi
male 130 40.0
female 126 29.0
female 115 25.0
male 120 33.0
female 128 34.0
...
我想一個數字摘要(0)繪製了sbp和bmi(1)之間的關係,並用R^2(2)估計了beta1,beta2和sigma參數。然後,檢查模型(3)的善良,並獲得置信區間(4)..
我認爲性是分類變量,所以這裏是我的代碼:
as.numeric(framingham$sex) - 1
apply(framingham, 2, class)
#0
framingham$sex <- factor (framingham$sex)
levels (framingham$sex) <- c("female", "male")
resultadoNumerico <- compareGroups(~., data = framingham)
resumenNumerico <- createTable(resultadoNumerico)
resumenNumerico
# 1
framinghamMatrix <- data.matrix(framingham)
pairs(framinghamMatrix)
cor(framinghamMatrix)
#2
regre <- lm(sbp ~ bmi+sex, data = framingham)
regreSum <- summary(regre)
regreSum
# Sigma
regreSum$sigma
# Betas
regreSum$coefficients
#3
plot(framingham$bmi, framingham$sbp, xlab = "SBP", ylab = "BMI")
abline (regre)
但我認爲我沒有做正確的事情...你能幫我嗎?在此先感謝...
我還沒有運行代碼,但你能說你爲什麼認爲你做錯了嗎? –
原因然後我需要比較男性和女性迴歸直線和模型的總結只給出一個:係數: 估計標準。錯誤t值Pr(> | t |) (截距)79.0624 11.0716 7.141 1.71e-10 *** bmi 1.9338 0.3965 4.877 4.21e-06 *** sexfemale 3.0395 3.7731 0.806 0.422 –
您只能得到1因爲另一個級別是參考級別,所以它是一個二級因子的級別。如果你們倆都陷入了「虛擬變量陷阱」,那麼結果將毫無意義。 http://www.algosome.com/articles/dummy-variable-trap-regression.html –