我正在開發模糊搜索機制。我有數據庫中的汽車品牌/模型和城市(mysql)(英文和俄文名稱) - 約1000項。用戶可以輸入錯誤或translit這個詞。現在我正在從db中檢索所有這些單詞,並將循環中的每個單詞與用戶輸入的單詞進行比較(使用livenstein距離和其他功能)。 有沒有什麼辦法來產生每個單詞(汽車品牌/模型)+錯誤的單詞的許多形式,因爲我想從數據庫中檢索這些單詞(使用像SQL運算符)。例如:我有汽車品牌:豐田,我想生成 - Tokota,Tobota,Toyoba,Tayota,Тойота,Токота,Тобота(俄語) - 每個單詞的許多形式。用戶可以輸入任何這個詞,我可以發現他是豐田他的意思。生成帶有錯誤的詞(汽車品牌/型號)
1
A
回答
2
那麼,在MySQL中有一個函數SOUNDEX
。我不知道這是你需要的。 例如:
SELECT SOUNDEX('Toyyota') == SOUNDEX('Toyota')
這裏是從MySQL文獻
返回從STR一個同音字符串。兩個聲音幾乎相同的字符串應該具有相同的soundex字符串。標準soundex字符串 是四個字符長,但SOUNDEX()函數返回一個任意長度的字符串 。您可以對結果使用SUBSTRING()以獲得標準soundex字符串 。 str中的所有非字母字符均忽略 。 A-Z範圍 以外的所有國際字母字符都視爲元音。
該功能目前正在實施,旨在與只有英文語言的 字符串配合良好。其他 語言中的字符串可能不會產生可靠的結果。
參考:http://dev.mysql.com/doc/refman/5.0/en/string-functions.html#function_soundex
相關問題
- 1. 增加汽車品牌車型年全國字典
- 2. 的JavaScript/AJAX車品牌/型號形式
- 3. 汽車自動填入品牌的選擇和模型
- 4. PHP preg_match汽車車牌
- 5. vb.net爲什麼模型只顯示一個汽車的品牌,但我的汽車顯示完全免費
- 6. 汽車的類型
- 7. 我如何組織品牌,型號和代車型在Redis的
- 8. 按車牌號比較汽車物件列表
- 9. 的CocoaPods「汽車財產合成」在安裝庫錯誤
- 10. 品牌:*** []錯誤1
- 11. C++汽車沒有指定類型
- 12. Perl腳本打印出汽車模型和汽車顏色
- 13. 汽車
- 14. SQL中的查詢顯示同一品牌汽車的平均價格
- 15. wsimport錯誤地生成枚舉類型並帶有下劃線
- 16. 是一款帶汽車保險槓貼紙子類的汽車嗎?
- 17. JAVA車牌號碼
- 18. Eclipse的汽車空間括號
- 19. Puma.NET DLL汽車號碼的識別
- 20. 撇號生成SQL錯誤
- 21. 汽車在MySQL的JDBC生成的密鑰
- 22. 如何緩存這個mysql查詢的車輛的品牌和型號?
- 23. 方案:爲什麼我收到此錯誤-assertion違章:錯誤類型[汽車]的參數(車「())
- 24. 從android車牌號碼/車牌圖片獲取號碼
- 25. 汽車賽車遊戲中的物理汽車聲音模擬
- 26. 使用swagger codegen cli生成帶有型號的Node.js服務器
- 27. 圖像中的細粒度車輛分類? (例如品牌,型號等)
- 28. 品牌:過濾含有給定單詞
- 29. 汽車性能和穩定的類型
- 30. 模型形式的Django汽車slu 012
非常感謝你。但我也有很多俄語的單詞。 – programmer
我需要搜索像Тойота,Токота,Тобота,Toyota,Toyyota – programmer