2013-02-13 45 views
-3

首先使用scikit-learn模塊的機器學習算法進行圖像處理,如何準備特徵圖像? 我可以用標準偏差(即最近的Neigbour還是集羣算法)對值進行歸一化? 或者我可以用(featureValue-min)/(max -min)進行線性縮放,就像我在這裏看到的那樣:http://www.csie.ntu.edu.tw/~cjlin/talks/mlss_kyoto.pdf用於svm。scikit-learn標準化值中的機器學習算法?

+2

我建議將您的問題重新描述爲「什麼是典型的必須在機器學習數據上執行的預處理步驟「。使用Scikit-learn或任何其他庫無關緊要。 – 2013-02-13 14:10:39

回答

2

請仔細閱讀下面的問題:ftp://ftp.sas.com/pub/neural/FAQ2.html#A_std 如果你的特徵是從高斯分佈中得出的,那麼你用SD和mean來標準化。否則,您只需進行標準化/重新調整,使其達到0-1的範圍。大量的預處理往往取決於數據和選擇的技術。找到最適合您的數據和技術。

0

並非所有的算法都需要規範化的輸入向量,例如隨機森林算法。然而,如果您選擇的算法要求歸一化,那麼SVM將對其進行歸一化處理,使用預處理模塊中的Sklearn中可用的歸一化器,並在擬合之前將數據轉換爲歸一化數據。此外,如果您嘗試對圖像進行分類,然後在sklearn中查看PCA(主成分分析),這有助於您使用選定的特徵進行處理,並提供更好的性能和結果。