餘弦相似度是根據對問題的回答決定2個用戶是否相似的好方法嗎?用戶推薦的餘弦相似度
我試圖讓用戶回答10個問題並解決對整數的10維向量的響應。然後,我計劃使用餘弦相似度來查找類似的用戶。
我考慮將每個問題解決爲一個整數並對整數進行求和以將每個用戶解析爲一個整數,但是這種方法的問題在於相似性度量不是問題特定的:換句話說,如果用戶給出問題1的答案解決爲5,問題2的答案解決爲0,另一個用戶回答問題1 0和問題2 5,兩個用戶「總計爲5」,但回答每個問題從根本上不同。
那麼餘弦相似度是否會根據每個屬性給出一個很好的相似度量度?