我有一組單詞('詞典'),並且我必須從字典中找到最接近的單詞,給定一個新單詞。 (我使用'word'作爲關鍵字,因爲它實際上是一個抽象'字母'的可變長度序列)。Levenstein-distance-like metric中的最近鄰居搜索
我使用Levenstein距離作爲度量的概括 - 我需要概括的原因是我需要交換兩個給定字母的特定「成本」 - 例如,我需要與'a'交換' b'與'c'交換'a'的成本更低。我想我仍然必須說服自己,我的泛化仍然是一個指標。
目前我正在使用樸素的線性搜索,即迭代字典中的所有單詞並跟蹤最小距離,我正在尋找更高效的方法。
我開始閱讀關於最近鄰搜索的方法,但是對於我來說,主要的概念難點是我的'點'(單詞)沒有嵌入到我可以想象的空間中,並且它們不是具有維度的向量等。
考慮到這一點,我想聽聽一些關於尋找哪些算法的建議。
謝謝,我會試一試並報告。 – 2011-04-28 06:35:21