我正試圖計算由entity_id,type_of_order,total_value描述的n個實體之間的相似度。n個實體之間的計算相似度
的數據的一個例子可能是這樣的:
NR entity_id type_of_order total_value
1 1 A 10
2 1 B 90
3 1 C 70
4 2 B 20
5 2 C 40
6 3 A 10
7 3 B 50
8 3 C 20
9 4 B 50
10 4 C 80
我的問題是什麼是衡量ENTITY_ID 1和2的例子之間的相似性與問候到type_of_order和total_value爲的神路訂單類型。
簡單的KNN會給出滿意的結果還是應該考慮其他算法?
任何建議將不勝感激。
什麼距離函數最好使用真的取決於應用程序。嘗試一下,看看哪個給你最好的結果。常見的包括L1和L2規範。您必須先將type_of_order映射到數字。 KNN是一種分類方案,而不是一個指標,所以我不知道如何使用它。或者我誤解了這個問題。 – Lidae