我有一個約有一百萬行的表格,裏面有500-600個文字,我正在這些文本中搜索單詞。但是迭代行和在文本內搜索從時間方面來看效率不高。任何想法?文本搜索算法
文本搜索算法
回答
有了這個稀缺的信息,我建議你看看inverted indexes。據我所知,易於構建和快速檢索您的案例。在任何類型的數據庫環境中也很容易實現,以防無法切換到已經支持它們的數據庫。
如果您提供更多信息,也許另一種解決方案也可以工作。
但我也使用levenshtein方法(edit_distance)來查看兩個單詞(用戶輸入的單詞和數據庫文本中的下一個單詞)的相似程度。我們怎樣才能以相同的方法使用倒排索引和levenshtein。我正在考慮。因爲如果在文本中找不到'貓',我想給予迴應,也許你正在搜索'帽子'有這樣的文本,其中包括'帽子'或用戶輸入quute,'我認爲你正在尋找'相當」'。 – Coenni
如果你想使用倒排索引和levensthein,你可以在一個trie中實現倒排索引。嘗試支持Levensthein查找,如果你做得對。每一片葉子將包含所有匹配文件的清單。請在下次問題中提供更詳細的信息,以便其他人直接找到合適的答案。 – LiKao
- 1. 文本搜索的最佳算法
- 2. 文件夾搜索算法
- 3. 搜索算法
- 4. 搜索算法
- 5. 樹搜索算法
- 6. 跳搜索算法
- 7. SQLAlchemy搜索算法
- 8. MySQL搜索算法
- 9. .net搜索算法?
- 10. 搜索算法 - Java
- 11. 本搜索算法的問題C#
- 12. 推薦本地搜索優化算法
- 13. 搜索最佳點搜索算法
- 14. 快速算法搜索文本文件內的模式
- 15. 文本索引算法
- 16. DICOM文件的搜索算法c#
- 17. 想出一個搜索算法來搜索文檔內
- 18. 搜索文本
- 19. 搜索文本
- 20. 算法來搜索文本中的單詞列表
- 21. 本地文件搜索與迭代算法
- 22. SPARQL中的搜索算法?
- 23. C++線性搜索算法
- 24. 搜索算法導致StackOverFlowError
- 25. A *搜索算法卡住
- 26. 實現A *搜索算法
- 27. 3D對稱搜索算法
- 28. 修改prestashops搜索算法
- 29. 使用A *搜索算法
- 30. 字符串搜索算法
你用什麼方法來存儲表格數據?平面文件? MySQL的?這對於你的問題 – Seph
mssql varchar(max)來說是一個相當重要的信息,但我可以改變存儲方法。我正在使用的c#,mssql。 – Coenni