0
我有兩組我想要找到相關性的數據。雖然有相當一些分散的數據,但顯然存在一種關係。我目前使用numpy polyfit(8階),但是有一些「擺動」的線條(特別是在開始和結束時),這是不恰當的。第二,我不認爲擬合得很好在該行的開頭(曲線應稍陡。通過分散擬合樣條
我怎樣才能得到一個最適合的「花」,通過這些數據點?
我當前的代碼:
# fit regression line
regressionLineOrder = 8
regressionLine = np.polyfit(data['x'], data['y'], regressionLineOrder)
p = np.poly1d(regressionLine)
這可以是更大的[交叉驗證](https://stats.stackexchange.com/)的,但在任何情況下,這些效應是天然的多項式適合。如果你想要更好的曲線,你可能需要使用更高級的迴歸技術; [scikit-learn](http://scikit-learn.org/stable/)提供了幾種算法。 [高斯過程](https://en.wikipedia.org/wiki/Gaussian_process)可能是一個很好的選擇,儘管可能太多數據直接使用它。 – jdehesa