2017-07-31 70 views
2

我執行迴歸分析並嘗試找到ggplot2中數據集diamonds.csv的最佳擬合模型。我使用價格(響應變量)與克拉,我執行線性迴歸,二次和三次迴歸。該線不是最合適的。我意識到來自excel的對數具有最佳擬合線。但是,我無法弄清楚如何在R中編碼來找到對數擬合線。任何人都可以幫忙R - Logarthmic的迴歸分析

VS克拉

model<-lm(price~carat, data = diamonds) 

模型2比較價格採用多項式來比較model3

model3 <- lm(price~carat + I(carat^2) + I(carat^3), data = diamonds) 

model2<-lm(price~carat + I(carat^2), data = diamonds) 

使用三次我如何代碼,日誌中的R得到與excel相同的結果?

Y = 0.4299ln(X) - 2.5495 R 2 = 0.8468

謝謝!

回答

0

您從excel y = 0.4299ln(x) - 2.5495報告的結果不包含任何多項式或立方項。你想做什麼? price是非常歪曲的,就像說'收入'一樣,通常的做法是從中獲取日誌。這也提供了你所指的R2,但截距和克拉參數的係數非常不同。

m1 <- lm(log(price) ~ carat, data = diamonds) 
summary(m1) 
Call: 
lm(formula = log(price) ~ carat, data = diamonds) 

Residuals: 
    Min  1Q Median  3Q  Max 
-6.2844 -0.2449 0.0335 0.2578 1.5642 

Coefficients: 
      Estimate Std. Error t value Pr(>|t|)  
(Intercept) 6.215021 0.003348 1856 <2e-16 *** 
carat  1.969757 0.003608  546 <2e-16 *** 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 0.3972 on 53938 degrees of freedom 
Multiple R-squared: 0.8468, Adjusted R-squared: 0.8468 
F-statistic: 2.981e+05 on 1 and 53938 DF, p-value: < 2.2e-16 
+0

非常感謝您的幫助!我通過你的幫助解決了這個問題。 logmodel < - lm(價格〜日誌(克拉),數據=鑽石) 摘要(logmodel) –

+0

好極了!不知道你爲什麼要克拉的日誌,但任何適合你的需求!如果你喜歡,請點贊/接受答案! – Richard

+0

即時消息對此不陌生。我在哪裏upvote和喜歡你的答案? –