1
A
回答
7
Soundex是一個非常古老而簡單的英文單詞哈希。它旨在匹配拼寫錯誤的單詞;例如「他們」,「他們」和「有」具有相同的Soundex代碼。
Soundex的問題包括它嚴重偏向於英語,並丟棄太多的數據,因此有很多誤報。一個更好的英文單詞算法是Metaphone。
如果您正在尋找與西班牙拼寫錯誤匹配的內容,則可以使用可以接受聲音表格(例如「asta」和「hasta」)的Double-Metaphone算法。您必須創建您自己的表格,並且我聽說雙倍音頻比單個音頻慢了幾個數量級。
另一種方法是更改Metaphone算法以使用西班牙音素而不是英語。有人已經done this in PHP。
相關問題
- 1. 有沒有比libnotify更好的東西?
- 2. 有沒有比reCaptcha更好的東西?
- 3. 比get_headers()更快的東西()
- 4. 比httrack更好的下載文件的東西?
- 5. 東西比.ToArray()更好的給力LINQ輸出的枚舉
- 6. 比圖更好的東西<string,map <string,vector>
- 7. 在OSX中有沒有比Navicat更好的東西?
- 8. 在JavaScript中有沒有比setTimeout更好的東西?
- 9. 有沒有比訪問控制列表(ACL)更好的東西?
- 10. Perl:有沒有比$ var = $ _;更好的東西?
- 11. 比標準庫更好的東西c#正則表達式
- 12. 東西好&關於SharePoint壞東西
- 13. 將PDF刮到更友好的東西
- 14. VSTS Loadrunner或更好的東西?
- 15. 比Sprite/BufferedImage更有效的東西。
- 16. windows中的emacs好東西
- 17. 比較Python中的東西
- 18. 當時間非常關鍵時,有沒有比NSTimer更好的東西?
- 19. 更新的東西在REST
- 20. 的東西更加明顯
- 21. 是Redis的好東西,我需要
- 22. 類庫中的資源好東西?
- 23. 更好的方法讓java做隨機的東西?
- 24. .Net 4.5中的新東西可以處理更好的JSON?
- 25. 更多的功能在一個控制器/東西/東西
- 26. 多個HTML東西的東西的東西
- 27. C - 雖然(東西||東西)
- 28. grep東西空間東西()
- 29. 複雜的東西在德比(Java DB)
- 30. Python正在打印比我想要的更多的東西
soundex是如何失敗的? – phkahler