3
A
回答
4
Nutch(Lucene)是一個開源引擎,它應該可以滿足您的需求。
1
在我terrier,用Java編寫的搜索引擎工作的過去:
梗是一個高度靈活,高效,有效和強大的搜索引擎,在文件的大型集合容易部署。 Terrier實現了最先進的索引和檢索功能。 Terrier爲快速開發大規模檢索應用程序提供了理想的平臺。
0
我已經花了近2年時間用C開發自己的高性能搜索引擎。對於Java,我強烈建議Apache Lucene作爲上面提到的Ajay。對於Java來說,它在速度,相關性和功能方面都是最好的。
+0
對不起,沒有閱讀完整的文章:P,如果你需要完整的包梗,在我看來更好,因爲lucene的(Nutch)爬蟲還年輕,幾個月前。 – 2009-08-29 09:07:27
+0
@John C:你也可以編輯你的答案來添加附加信息 – sth 2009-08-30 15:56:20
相關問題
- 1. 什麼是嵌入網站的好搜索引擎
- 2. 什麼哈希函數用於網絡搜索引擎索引
- 3. 什麼是優化的網頁搜索引擎
- 4. 爬蟲/搜索引擎如何遍歷網絡?
- 5. 搜索引擎友好的網址
- 6. 搜索引擎友好的網址與/
- 7. 阻止搜索引擎索引網頁
- 8. Scrapy網絡爬行不好
- 9. 網絡爬蟲的工作是什麼?
- 10. 構建網絡搜索引擎
- 11. 搜索引擎友好網址.htaccess
- 12. 什麼是一些好的代碼搜索網頁界面?
- 13. 爬行/報廢搜索表單網頁
- 14. 什麼是最好的網絡圖像搜索API?
- 15. 如何使用Express檢測搜索引擎優化的網絡爬蟲?
- 16. Opencart作爲搜索引擎優化網頁的搜索頁面
- 17. BeautifulSoup -ing一個網站登錄和網站搜索引擎
- 18. java網絡爬蟲
- 19. 什麼是一個很好的網頁爬蟲下載HTML頁面?
- 20. 爲什麼搜索引擎爬蟲不能運行JavaScript?
- 21. 網絡爬行 - 識別Java網頁上的主要內容
- 22. 漂亮的URL和搜索引擎優化友好的網址?
- 23. 搜索引擎沒有爬行?
- 24. 搜索引擎拖網安全頁面
- 25. 使用搜索引擎打開網頁
- 26. 搜索引擎網頁摘要
- 27. 是否有一個好的Node.js索引/搜索引擎?
- 28. 用於網絡排名和搜索引擎的C++庫
- 29. 網絡爬蟲的Java
- 30. Java 8 CompletedFuture網絡爬蟲不爬行一個URL
對不起,我加這麼晚。首先我探討了這個選項使用它,發現它對我有用。 Lucene是最好的選擇,可能有其他類似的梗,但我沒有探索它,因爲我發現了Lucene所需的所有東西。 Thanx – 2009-10-30 14:09:00
很好,你已經找到了你需要的東西 – Ajay 2009-11-02 07:31:49