我在我的mysql數據庫中有2,000,000個字符串。現在,當一個新的字符串作爲輸入時,我試圖找出該字符串是否已經在我的數據庫中,否則,我插入字符串。位置獨立字符串匹配
字符串匹配
對於我的情況下的定義,在文本中單詞的位置並不重要。只有所有單詞都應該出現在字符串中,並且任何一個字符串中都沒有額外的單詞。
Ex - 拉姆是男孩 AND 男孩是拉姆將被稱爲匹配。 拉姆是個好男孩不匹配。
PS - 請忽略感
現在,我的問題是:如何做這些匹配給出一個字符串(2000000)的數量我要匹配的最佳方式。
解決方案我能想到的:
- 指數中的所有SOLR串/獅身人面像
- 在新的搜索,我只是將 點擊搜索服務器,並有在最高前10名的字符串考慮
優點: -
- 比MySQL全文搜索更快
缺點: - 在MySQL數據庫 用新的查詢更新
- 保持搜索服務器。
有沒有其他更好的解決方案,我可以去?任何建議和方法來解決這個問題是最受歡迎的:)
謝謝!
這是一個很棒的想法:) –
排序的話,摺疊的情況下,刪除重複的 – ChuckCottrill
MySQL的排序規則可能會照顧你的摺疊情況:) – barryhunter