1
我讀這樣的問題:使用局部敏感散列時的餘弦相似度是否爲-1?
How to understand Locality Sensitive Hashing?
但是,我發現,計算餘弦相似性的方程如下: 的Cos(V1,V2)= cos(THETA)=(漢明距離/簽名長度)* pi =((h/b)* pi)
這意味着如果向量完全相似,則漢明距離爲零,餘弦值爲1.但是當向量完全不是相似,那麼漢明距離將等於簽名長度,所以我們有cos(pi),這將導致-1。相似性不應總是在0和1之間嗎?
你能否澄清你的最後一點?你的意思是說,在多維空間中,天使總是在0到90之間?如果是這樣,爲什麼?我其實並不瞭解你的意思,「每個維度的價值都是非負面的」。 –
當您有文本數據時,給定單詞的字數不可能是負數。通常每個單詞代表它自己的尺寸,因此角度總是在0°和90°之間。 –