2013-09-30 55 views
0

我一直試圖規範化我的數據集,其中包含許多不同分佈,規範化,積極傾斜和負面傾斜的功能。 作爲構建分類模型的初步步驟,執行數據標準化時,是否應將相同的標準化技術應用於數據集中的所有要素,還是應該針對數據集中的不同要素應用不同的標準化技術?雖然執行數據規範化應該我應用不同的功能不同的功能

回答

0

也許

沒有一個通用的規則。

如果您在小範圍內有x,y座標,是的,那麼使用相同的標準化可能更合適。與「相同規模」相同,不僅僅是「相同的方法」。如果你有經度和緯度,不要做任何正常化,除非你有理由認爲地球扭曲了。 如果你有完全不同的比例尺,比如屬性A是「鞋號」,屬性B是「pi/shoe-size」,那麼YES,你需要對這兩個屬性進行不同的歸一化。

通常,當這個問題出現時,您還沒有理解您的數據。