2012-06-18 19 views
0

我想創建一個自動同義詞查找算法(主要用於品牌名稱)。例如,如果用戶輸入單詞「可口可樂」,我想返回單詞「可樂」。同義詞查找器文本挖掘算法

這可以很容易地使用dictoniaries來完成;但比我需要一個dictonary文件。 我如何自動創建一個? (我有一個有100萬條記錄的小語料庫,同義詞將來自這個)。

這個問題有沒有文本挖掘算法? 此外,也有一些這方面的在線代名詞服務,但這些不包含品牌名稱:-(

感謝, krisy

+0

什麼你的記錄看起來像嗎?你可以將你的記錄集中在一起尋找類似的詞條嗎? –

回答

0

特里樹基於算法可以找到同義詞或相似的詞。它不使用密鑰,但位置在樹中定義密鑰,例如從A到B到B到C到C有很多數據結構,最簡單的是一個鄰接列表或一個三元搜索樹

+0

你如何建議爲「可口可樂」找到「可樂」將與嘗試一起工作? ry單詞/拼寫錯誤的單詞,但我不明白它們如何用於synonims :-( – krisy

+0

顯示字母C下的第一個匹配的樹? – Bytemain

+0

我擔心會有太多的話返回:-( – krisy