我想要選擇與行標題columun相似的行。標題columun大多有5或6個關鍵字。你推薦哪種算法? Soundex也許?在Mysql中查找類似行的建議
P.S:標題columun具有統一chracters如C,O,S ...
我想要選擇與行標題columun相似的行。標題columun大多有5或6個關鍵字。你推薦哪種算法? Soundex也許?在Mysql中查找類似行的建議
P.S:標題columun具有統一chracters如C,O,S ...
我的問題的答案MySQL的全文搜索匹配在一起。它也支持unicode。
SELECT *, match(project_title) against('sample project 55') as similarity
FROM projects
WHERE status IN(1, 2, 3, 4, 5, 6) AND id != ? AND match('sample project 55') against(?)
ORDER BY similarity DESC
如果你的意思是在拼寫和發音相似,我會考慮使用SOUNDEX
功能。
老實說,我會爲keywords(id, external_id, keyword)
創建一個表格,然後我會根據自己的順序加入表格,按順序排列多少匹配,然後再將這些行抓回去。
如果您只對單行進行匹配,則只能選擇那一行,從而提高連接的效率。
這可能與SOUNDEX相結合的東西是接近