15
例如Soundex算法針對英語進行了優化。是否有更適用於大型語言族的更通用的算法?如何製作國際Soundex?
例如Soundex算法針對英語進行了優化。是否有更適用於大型語言族的更通用的算法?如何製作國際Soundex?
SOUNDEX確實是以英語爲導向的。考慮到更廣泛的語音差異的另外兩個是:Double Metaphone和NYSIIS。
它們產生的編碼可能比SOUNDEX大得多。雙倍變音器,具體地說,包括基於比英語更多的語言處理替代發音的明確目的的減少。
我最近做了關於模糊字符串匹配的演示,the slides可能會有所幫助。
您的幻燈片的鏈接已損壞(404) – 2009-09-26 05:29:25