0
我正在研究關鍵字提取系統,在prepossessing之後,系統通過檢查匹配相同模式的文本提取候選關鍵字如何找到字符串相似度?
現在我想知道如何找到提取的候選關鍵字之間的相似度意義? 例如,讓我們看看接下來的矩陣:
k1 k2 k3
k1 1 ?1 ?2
k2 ?1 1 ?3
k3 ?2 ?3 1
how can I find the values of (?) ???
where
(?1) refer to the sense similarity degree between (k1) and (k2)
(?2) refer to the sense similarity degree between (k1) and (k3)
(?3) refer to the sense similarity degree between (k2) and (k3)
注:關鍵字可以是1個字以上
你是否有資格成爲相似性?長度差異?字符?從一個詞到另一個詞的變化數量? –
你在說[Levenshtein distance](http://en.wikipedia.org/wiki/Levenshtein_distance)嗎? – jerry
我的意思是詞義相似性.... 意義上的相似程度 –