我期待構建一個預測模型,並且正在使用我們當前的JMP模型。我們目前的方法是猜測一個n次多項式,然後看看哪些項不是重要的模型效應。多項式並不總是最好的,這會導致很多混淆和不好的模型。我們的數據可以有2到7個效果,並且總是有一個響應。針對n變量預測方程的Python模型
我想爲此使用python,但是對於像這樣的包文檔或在線指南很難找到。我知道如何擬合特定的n次多項式或在python中做線性迴歸,但不知道如何猜測數據集的最佳函數類型。
我是否錯過了一些明顯的東西,或者我應該寫一些探測各種函數類型的東西?精度是最重要的。我正在使用一個小的(〜2000x100)數據集。
我可以對較小的訓練集進行迴歸,對驗證集進行測試,然後對模型進行排序並選擇最佳。有什麼更好的嗎?