0
我有一個模型,我正在使用兩個數據集,訓練&測試。我需要在使用scikit-learn構建模型之前使預測變量正常化。如何在訓練中使用sigma/mu來校正第二測試數據集中的預測數據?
比方說我的模型訓練數據:
Training[X1] has mean=10,stddev=1.5
Training[X2] has mean=45,stddev=17
etc...
而且我對測試數據文件
Testing[X1] has mean=9,stddev=1.8
Testing[X2] has mean=40,stddev=13
etc...
以便它使用相同的比例與原來我如何標準化測試數據文件數據集?
我嘗試使用此代碼,但它似乎不看的權利乍一看:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)
正確,我的測試數據集(少於1k條記錄)與訓練集(65k記錄)相比非常小。感謝您的確認,我必須更仔細地研究模型,以確定是否有其他問題。 – NumericOverflow