我試圖計算2個句子之間的相似度,所以我有2個單詞集合,每個代表一個句子,還有一個函數(F)接收兩個單詞並返回它們之間的相似度一個方式.. 測量2個向量之間的相似度
在圖像1中,黑圓圈是句子A的話,紅色正方形表示句子B. 對於每個時間函數(F)接收2個字,它返回0.0之間的值和1.0,例如:A中的第一個單詞和B中的第三個單詞具有0.3的相似性分數。 我已經使用了M×N的比較,因爲這兩個句子的順序往往不一樣,還有一些單詞。
我的問題是:
讓所有M×N的比較分數後,我怎麼能拿0.0和1.0表示兩個 句子或列表的相似性之間的最終比分 ? 「由於兩句話的長度不總是 等於」。
如果這種方法不對,有什麼選擇?
有趣。你是如何定義類似的? –
我不認爲你確切地知道你在做什麼。你有相似性分數矩陣嗎?我不確定M×N比較是什麼意思。這個問題與某些「相似性」主題或數學有關嗎?也許缺乏「相似性」經驗的人仍然可以提供幫助。 –
@NickZiebert,語義上在本體中使用最短路徑。 –