您在R中使用哪些函數來擬合曲線以適合您的數據並測試該曲線的擬合程度?什麼結果被認爲是好的?R中擬合函數的優劣
回答
只是該問題的第一部分可以填滿整本書。只是一些快速的選擇:
lm()
標準線性模型glm()
廣義線性模型(如Logistic迴歸)rlm()
從穩健的線性模型lmrob()
從包robustbase魯棒包MASS線性型號loess()
適用於非線性/非參數型號
然後有特定於領域的模型,例如,時間序列,微觀計量經濟學,混合效應等等。幾個任務視圖例如Econometrics更詳細地討論這一點。至於合體的好處,這也是人們可以輕鬆花費整本書討論的東西。
任何書籍或良好網站的合適建議的建議? – 2010-06-15 20:39:33
nls()
函數(http://sekhon.berkeley.edu/stats/html/nls.html)非常適用於非線性最小二乘曲線擬合。卡方平方(殘差的平方和)是在這種情況下進行了優化的度量標準,但它不是標準化的,因此您不能輕易使用它來確定適合度。你應該確保的主要事情是你的殘差是正態分佈的。不幸的是,我不確定採用自動化的方式來做到這一點。
快速R站點有用於擬合模型的基本功能合理的很好的總結和檢驗的配合,與樣品R代碼一起:
擬合典範曲線的馱馬在R中是lm()
,glm()
和nls()
。對我而言,擬合優度是模型選擇這個大問題中的一個子問題。事實上,錯誤地使用擬合優度(例如,通過逐步迴歸)會導致嚴重錯誤指定的模型(參見Harrell關於「迴歸建模策略」的書)。我沒有從零開始討論這個問題,而是推薦Harrell的書lm
和glm
。 Venables和Ripley的聖經很簡潔,但仍值得一讀。通過Faraway「用R擴展線性模型」是全面和可讀的。這些來源不包括nls,但是Ritz的「R非線性迴歸」Strebig填補了空白,非常實用。
你應該確保的主要事情是 你的殘差通常 分佈。不幸的是,我不是 肯定是一種自動化的方式來做到這一點。
qqnorm()
很可能被修改,以找到樣本分位數和理論位數之間的相關性。基本上,這只是對正態分位數圖的數值解釋。也許提供不同範圍的分位數的相關係數的幾個值可能是有用的。例如,如果中間97%的數據的相關係數接近於1,而尾部的相關係數低得多,這告訴我們殘差的分佈大致正常,尾部有一些滑稽現象。
最好保持簡單,並查看線性方法是否可以「很有效」。通過查看R平方和F統計量,您可以一起判斷您的適合度,從不分開。將與變量無關的變量添加到您的模型中可以增加R2,因此您還必須考慮F統計量。
您還應該將您的模型與其他嵌套或更簡單的模型進行比較。使用log liklihood比率測試,只要因變量相同。
Jarque-Bera測試對於測試剩餘分佈的正態性是很好的。
- 1. R中的優化函數
- 2. R中的擬合指數
- 3. 擬合R中
- 4. 優劣豆vs SSJS?
- 5. R中的合併函數
- 6. R中的聚合函數
- 7. 將擬合模擬模型擬合爲R中的最優數據時的錯誤
- 8. 擬合函數
- 9. 擬合函數
- 10. 曲線用於使用中的R的函數擬合GGPLOT2
- 11. 在r中優化函數的功能
- 12. 如何估計R中散點圖的最佳擬合函數?
- 13. 擬合分佈數據中的R
- 14. R優化線性函數
- 15. 擬合調和函數爲時間序列R中
- 16. 非線性擬合R中
- 17. 通過集合中的lambda表達式使用函數委託會有什麼優勢/劣勢嗎?
- 18. R的ets函數的優化準則
- 19. 通過使用R Langauge的Kolmogorov-Smirnov測試的擬合優度
- 20. R:將數據點穩健地擬合成高斯函數
- 21. 比較玩家的優勢和劣勢
- 22. Tomcat集羣的優勢和劣勢
- 23. 虛擬函數調用的優化
- 24. SPSS中的哪個函數模擬R summary()函數?
- 25. R優化給出的目標函數
- 26. 優化與聚合函數
- 27. SQL聚合函數優化
- 28. 優化擬合係數以便更好地擬合
- 29. 擬合函數從ECDF
- 30. vis.js網絡擬合函數
我已經使用過商業軟件,可以嘗試很多公式(需要幾小時,如果你喜歡)來找到最合適的。我很想在R中找到類似的東西。 – Nosredna 2009-07-25 02:53:02
失望 - 我認爲R是實數的範疇。 – 2009-07-25 21:16:27