-1
我正在開發一個近似計算系統。定義這兩個對象的相似程度是這種系統的基本操作。還有其他有用的相似度或距離度量標準嗎?
通常在計算機科學和數學,相似性是兩個物體之間的距離的代名詞,但它並不總是很清楚,我在這類型的應用程序下面的距離被使用:
- 傑卡德係數是用於排名和評分的信息檢索。
- 餘弦相似度用於實向量和它的使用用於例如測量文檔之間的相似性(即使它不考慮術語位置,但只有頻率)
- 海明距離用於二元載體和它用於測量計算機視覺和圖像處理中二進制描述符(如ORB)之間的相似度
- 歐幾里德距離用於實數矢量,它用於測量兩點之間的距離(通常將其作爲L^2距離)
- 內核函數:在機器學習中使用了一些內核函數(如RBF內核)來進行相似性度量,利用內核技巧。
我知道這些指標中的每一個都是以不同的方式定義的,但我想知道是否有調查報告或論文列出了計算機科學中每一種可能的應用(或其他人)不要報告)。你能幫助我嗎?
[關於概率密度函數之間的距離/相似性測量的綜合調查](http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.154.8446),[距離/相似性度量的調查對於分類數據](http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=6889941),[二元相似性和距離測量的調查](http://citeseerx.ist.psu.edu/viewdoc /summary?doi=10.1.1.352.6123),[二元和數字數據的相似度量: 調查](http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.212.6533) – rcpinto
也是一個修正:歐幾里德距離適用於任何維數,而不僅僅是2。 – rcpinto