我正在開發一個應用程序,它將從網站上抓取數據。諸如page_url,site_url,last_modified的細節將被存儲在數據庫中,並且page_content將被存儲在文件中。稍後我要搜索文件的內容。我正在嘗試Thinkingsphinx來實現這一點。任何機構有一個想法如何實施它?使用SPHINX/ultrasphinx對索引文件進行索引
0
A
回答
1
我不相信Sphinx/ThinkingSphinx適合你,因爲他們打算與數據庫交談。
0
你能切換到Solr全文搜索呢?我聽說它可以像PDF或字
http://lucene.apache.org/solr/tutorial.html[enter鏈接這裏描述]即使指數二進制文件[1]
相關問題
- 1. 如何使用Apache索引對文件系統進行索引
- 2. 使用索引對索引HTML進行索引
- 3. 對大量XML文件進行索引
- 4. 使用2dsphere索引和IP地址索引對mongodb集合進行索引
- 5. 使用hash#對網址進行索引
- 6. 對查詢進行索引
- 7. 使用sqlite進行搜索索引?
- 8. 使用搜索索引進行篩選
- 9. 使用PostgreSQL中的約束對ORDER BY使用的索引進行索引
- 10. 索引對使用&&
- 11. 使用索引數組在Python中進行索引
- 12. 在Deep Link中使用&符號進行索引編制索引
- 13. 按R索引對索引進行排序
- 14. ElasticSearch索引 - 選擇Java對象進行索引?
- 15. R使用行索引合併文件
- 16. 使用python對基於索引和非索引列的表值進行排序
- 17. 使用索引對數組進行排序會導致索引太多
- 18. 用Lucy進行索引和搜索
- 19. 如何應用索引進行搜索
- 20. 文件索引
- 21. 使用Solrnet對富文檔進行索引
- 22. db索引文件執行
- 23. 對檔案文件進行全文索引
- 24. 使用$和參數進行索引?
- 25. 使用列索引進行dplyr 0.5.0 mutate
- 26. 使用Matplotlib進行多索引繪圖
- 27. 使用Git進行源碼索引
- 28. 阻止使用索引進行查詢
- 29. 使用Lucene.net進行索引版本化
- 30. 使用索引進行數字排序
你能建議我一個很好的解決方案然後? – Pravin 2011-03-22 09:49:40
我不知道有我自己。我現在快速瀏覽一下,如果我找到任何東西,我會告訴你。我可以說,Solr /太陽黑子看起來不像選項:) – lebreeze 2011-03-22 09:50:33
獅身人面像下的xmlpipe選項呢?我實際上正在努力實現,但沒有得到如何.. – Pravin 2011-03-22 09:51:49