scikit-learn標準化值中的機器學習算法？

-3

首先使用scikit-learn模塊的機器學習算法進行圖像處理，如何準備特徵圖像？我可以用標準偏差（即最近的Neigbour還是集羣算法）對值進行歸一化？或者我可以用（featureValue-min）/（max -min）進行線性縮放，就像我在這裏看到的那樣：http://www.csie.ntu.edu.tw/~cjlin/talks/mlss_kyoto.pdf用於svm。scikit-learn標準化值中的機器學習算法？

來源

2013-02-13 postgres

我建議將您的問題重新描述爲「什麼是典型的必須在機器學習數據上執行的預處理步驟「。使用Scikit-learn或任何其他庫無關緊要。 – 2013-02-13 14:10:39

請仔細閱讀下面的問題：ftp://ftp.sas.com/pub/neural/FAQ2.html#A_std 如果你的特徵是從高斯分佈中得出的，那麼你用SD和mean來標準化。否則，您只需進行標準化/重新調整，使其達到0-1的範圍。大量的預處理往往取決於數據和選擇的技術。找到最適合您的數據和技術。

來源

2013-02-13 14:09:08

並非所有的算法都需要規範化的輸入向量，例如隨機森林算法。然而，如果您選擇的算法要求歸一化，那麼SVM將對其進行歸一化處理，使用預處理模塊中的Sklearn中可用的歸一化器，並在擬合之前將數據轉換爲歸一化數據。此外，如果您嘗試對圖像進行分類，然後在sklearn中查看PCA（主成分分析），這有助於您使用選定的特徵進行處理，並提供更好的性能和結果。

來源

2016-11-20 13:15:40

scikit-learn標準化值中的機器學習算法？

回答

相關問題