2015-10-17 29 views
0

假設我有一個對象X具有一組10個功能:[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]是否有一個度量標準來評估兩個對象之間的相似性,基於它們的屬性?

然後,我有兩個對象:

  • A : [2, 2, 2, 2, 2, 2, 2, 2, 2, 2]
  • B : [0, 0, 0, 0, 0, 0, 0, 0, 0, 20]

我需要知道從AB是 「接近」 X

的想法,我心目中的背後「相似性」是:

較好的是,所有的功能都幾乎一樣,而不是許多人非常接近,但一些非常不同的。

根據這個 「定義」,A似乎比B接近X

但是,算術平均值似乎並不是實現這一想法的正確工具,因爲它對於兩個對象都是2。

請問這種問題是否有一個特定的指標?

回答

1

那麼euclidean distance呢?在你的情況下,A和X之間的歐幾里德距離是40(約6.32)的平方根,B和X之間的距離是20,所以A確實更接近該度量。

+0

好吧,這似乎是我正在尋找的,謝謝! – Delgan

0

在特徵非常不相似且情況可能不同的情況下,歐氏距離必須標準化。

這可以使用Mahalanobis distance來完成,其中涉及特徵的方差。

Mahalanobis distance

而且,看this question

1

你也可以考慮使用餘弦相似度。餘弦相似度度量向量相對於原點的相似度,而歐幾里德距離度量沿着向量的特定感興趣點之間的距離。

Here是一篇關於何時從另一篇文章中挑選的文章。

另一個常見的措施是Jaccard相似性。 Here是比較餘弦與Jaccard相似性的文章。

相關問題