我正在爲基於Web的所見即所得編輯器實現拼寫檢查功能。我目前使用Damerau-Levenshtein距離算法來產生拼寫建議的列表。這一切都很好,但我很好奇如何改進功能。聯合詞的拼寫建議
具體來說,我的實現目前不處理連詞。例如,我希望能夠檢測到「areyou」,並建議「是你」。我想我可以做到這一點,把可能的聯合詞拆分成可能看起來細分和測試兩個部分。由於所有英文單詞都必須至少有一個元音,因此我認爲我可以尋找元音來幫助我決定將單詞分開的位置。
Damerau-Levenshtein距離算法非常有用;很明顯,其他人比我更多地考慮了這一點。有沒有類似的聰明算法,我應該考慮檢測聯體詞,還是我已經在正確的軌道上了?
你會如何處理「區域」? – tvanfosson 2009-11-18 19:07:51
「區域」將被標記爲正確的,因爲它在我的單詞列表中。我確定。 – 2009-11-18 19:22:37