2017-04-01 52 views
1

在機器學習中,如何處理薪水等功能。例如,如果我通過測量基於特徵的數據點之間的距離來應用k最近的鄰居。假設我們有兩點薪水爲2000和6000.他們之間的差異是4000.讓我們再看兩點薪水爲102000和106000.這裏的差異仍然是4000美元,但我們人類認爲最後兩個點更接近或更相似前兩點。在不同範圍內具有不同含義的功能

如何在機器學習中融入這種直覺?

+0

標準化和規範我的朋友 –

回答

1

你可以做以下的事情之一(還有更多):

  • 使用日誌功能(因此2000和6000將遠遠超出102000和106000)
  • 二值化特徵變換特徵爲多個桶(你將創造薪水每個範圍內的功能,你是一個創造桶)的K-NN
  • 變化相似的功能相對於看差的絕對值,而不是
相關問題