我應該用Java編寫一個web爬蟲。爬行部分很容易,但索引部分很困難。我需要能夠查詢索引器並讓它返回匹配(多個字查詢)。做這樣的事情最好的數據結構是什麼?在Java中創建Web索引器?
0
A
回答
0
如果你是從頭開始創建的,你應該看看inverted index的數據結構。如果您可以使用現成的貨架,請查看Nutch項目。
1
1
該溶液到索引&搜索步驟是使用一個inverted index數據結構,並且實現此用於索引的最佳可用開源包&搜索是Lucence。
還有一些開源項目爲搜索,索引&提供了一個可能感興趣的搜索步驟的綜合解決方案。 nutch
這個關於信息檢索的free online book可能對你有所幫助(見章節constructing an inverted index)。
相關問題
- 1. 創建索引文件Java
- 2. 創建索引 - 彈性搜索 - Java API
- 3. 如何使用splunk web創建索引?
- 4. 使用Java的web索引器
- 5. 在彈性搜索中使用java api創建索引模板
- 6. 彈性搜索 - 在java中創建節點/索引時出錯
- 7. 創建索引
- 8. 在創建表上創建索引
- 9. 無法使用JAVA API創建索引
- 10. 使用批量API創建索引java
- 11. 在SQLite中爲全文搜索索引創建SQL觸發器
- 12. 創建索引MongoDB中
- 13. 在Java中創建JSON Web令牌
- 14. 創建索引Nest
- 15. 索引未創建
- 16. postgres創建索引
- 17. 創建索引MATLAB
- 18. 創建索引列
- 19. MySQL索引創建
- 20. 在java中構建搜索引擎
- 21. 如何在ES API中創建多重索引Java
- 22. 如何在java中創建索引文件?
- 23. 如何在java中創建索引文件
- 24. 如何在java中創建倒排索引
- 25. 如何在Java中創建簡單的前綴索引?
- 26. 在java中創建數組的特定索引字符串?
- 27. 在Objectbox中創建唯一索引
- 28. Marklogic - 在集合中創建索引?
- 29. 在MongoDB中創建兩個索引
- 30. 如何在sql中創建索引列?