2015-03-02 109 views
0

我在選擇適當距離函數以測量兩個相對頻率矢量之間的相似性(不相似性)時遇到問題。測量兩個相對頻率矢量之間的距離

更具體地說,我使用的形狀特徵向量包含有關圖像中存在的基本形狀(圓形,三角形,方形)的數據。因此,該載體是在形式

[% of circles, % of triangles, % of squares]

例如,如果圖像包含4個圈,2個三角形和4個方格,然後它的形狀特徵矢量應爲:

[0.4, 0.2, 0.4]

的最初的想法是簡單地測量兩個向量特徵的相應元素之間的歐氏(Euclidean),然後將結果添加到一起。但我不相信這是最好的方法。有人可以提出一個好的方法來衡量這兩個向量之間的距離,或建議任何算法的這種情況?需要更復雜的概率距離函數來獲得良好結果,例如Chi-Squared或Kullback Leibler Divergence距離函數?

感謝 彼得

回答

1

什麼距離函數的使用取決於你的具體任務。

我猜cosine similarity可能是你想要的。

+0

謝謝你的建議。該任務涉及使用圖像特徵執行檢索的簡單圖像檢索系統。簡單地說,其中一個選項是讓用戶選擇他想要圖像的形狀的種類和數量。如果用戶將系統設置爲檢索由4個圓圈,2個三角形和4個方塊組成的圖像,系統會自動創建用作查詢的特徵矢量「[0.4,0.2,0.4]」,然後檢索最接近的結果通過測量該特徵與集合中圖像的所有形狀特徵向量的相似度。 – peterS 2015-03-02 18:36:28