4
A
回答
7
以下查詢使用數值穩定且易於修改的計算來執行線性迴歸,以處理任何輸入表。它使用內建函數CORR生成最適合模型Y = SLOPE * X + INTERCEPT和Pearson相關係數的斜率和截距。
作爲一個例子,我們使用公共天賦數據集來計算出生體重作爲妊娠持續時間的線性函數,按照狀態進行細分。你可以寫得更緊湊,但我們使用幾層子查詢來突出顯示這些部分如何結合在一起。要將其應用於其他數據集,只需要替換最內層的查詢。
SELECT Bucket,
SLOPE,
(SUM_OF_Y - SLOPE * SUM_OF_X)/N AS INTERCEPT,
CORRELATION
FROM (
SELECT Bucket,
N,
SUM_OF_X,
SUM_OF_Y,
CORRELATION * STDDEV_OF_Y/STDDEV_OF_X AS SLOPE,
CORRELATION
FROM (
SELECT Bucket,
COUNT(*) AS N,
SUM(X) AS SUM_OF_X,
SUM(Y) AS SUM_OF_Y,
STDDEV_POP(X) AS STDDEV_OF_X,
STDDEV_POP(Y) AS STDDEV_OF_Y,
CORR(X,Y) AS CORRELATION
FROM (SELECT state AS Bucket,
gestation_weeks AS X,
weight_pounds AS Y
FROM [publicdata.samples.natality])
WHERE Bucket IS NOT NULL AND
X IS NOT NULL AND
Y IS NOT NULL
GROUP BY Bucket));
使用STDDEV_POP和CORR功能提高了查詢的數值穩定性比較X和Y的產品總結,然後採取區別和劃分,但如果你在一個乖巧的數據集使用這兩種方法,你可以驗證他們產生相同的結果以高精度。
相關問題
- 1. 如何在python中執行線性迴歸時減少rmse
- 2. 錯誤執行非線性迴歸
- 3. Julia |如何在TimeArray數據集上執行線性迴歸
- 4. 如何對我的數據執行非線性迴歸
- 5. 如何在Spark MLLib中進行多目標線性迴歸?
- 6. 如何在多元線性迴歸模型中進行預測?
- 7. 執行多元線性迴歸時返回nan in for函數
- 8. 多元線性迴歸如何在本質上是線性的?
- 9. 線性迴歸與R中
- 10. theano中的線性迴歸
- 11. 如何在此圖中繪製線性迴歸線?
- 12. R線性迴歸
- 13. 線性迴歸用
- 14. 線性迴歸scala.MatchError:
- 15. Java線性迴歸
- 16. 如何做這個線性迴歸?
- 17. 如何用R創建線性迴歸?
- 18. 自迴歸線性迴歸data.frame
- 19. 是否可以執行多分段線性迴歸模型?
- 20. 對數據執行線性迴歸(來自.arff文件) - JAVA,Weka
- 21. 我用線性迴歸簡單的預測不會執行
- 22. 在線性迴歸中使用PCA
- 23. 在R中應用SVD線性迴歸
- 24. 在Matlab中的線性迴歸模型
- 25. 在R中繪製非線性迴歸
- 26. 在線線性迴歸與遺忘
- 27. 使用postgres進行線性迴歸
- 28. 使用matplotlib/numpy進行線性迴歸
- 29. 線性迴歸分析 - 滾動行
- 30. 如何在2D散點圖上創建線性迴歸線