我正在使用solr搜索引擎來進行文檔回覆中的項目目的。我的數據集是.txt文件格式。但是solr只給出了json,xml,pdf和其他一些文件格式的選項。沒有文本文件的選項。
對於使用.txt文件作爲數據集,我需要對solr進行一些修改嗎?我們可以搜索Solr搜索引擎中的.txt文件嗎?
0
A
回答
0
所有你需要做的 - 就是索引你的txt文件。
欲瞭解更多信息和具體的例子看看這裏 - http://www.slideshare.net/LucidImagination/indexing-text-and-html-files-with-solr-4063407
0
最有可能你將有空格分隔文件以.txt files.So索引文本文件,你可以寫Python腳本流文檔解決並執行提交。
0
除了txt文件,Solr還可以索引其他幾種文檔格式。詳情請看Apache Tika。
0
您可以使用CSV請求處理程序來處理此問題。 https://wiki.apache.org/solr/UpdateCSV 在這裏,您可以配置分隔符和轉義字符。例如:如果你有一個「|」分隔文件,您可以指定「& separator = |」
下面是索引標籤有限文本文件:
捲曲 'http://localhost:8983/solr/update/csv?commit=true&separator=%09&escape= \ & stream.file =/TMP /的Result.txt'
0
我發現了快速啓動引導在一個非常有用的線https://lucene.apache.org/solr/5_3_1/quickstart.html
java -classpath /solr-5.0.0/dist/solr-core-5.0.0.jar -Dauto=yes
-Dc=gettingstarted -Ddata=files -Drecursive=yes org.apache.solr.util.SimplePostTool docs/
對我來說特別有用的部分是-Dauto=yes
。當此選項打開時,Solr的可以處理許多類型的文件(不要問我爲什麼)
Entering auto mode. File endings considered are xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
我所知道的是,我打開該選項,而現在我的實例將接受PDF,XML和txt文件。
相關問題
- 1. 可以Solr索引/搜索靜態文件嗎?
- 2. 我可以使用Solr來搜索現有的Lucene索引嗎?
- 3. 使用AJAX搜索引擎在Chrome中搜索搜索引擎
- 4. 搜索引擎可以索引JavaScript生成的網頁嗎?
- 5. 用於文件搜索的可安裝的搜索引擎包
- 6. Apache Solr搜索可以索引但不搜索
- 7. 搜索引擎索引JSON結果嗎?
- 8. 我們可以在同一個Solr索引中使用不同的語言進行索引和搜索嗎?
- 9. 我們可以告訴Solr/Lucene max chars分析搜索嗎?
- 10. 可以搜索引擎搜索查詢字符串中的內容嗎?
- 11. Solr搜索引擎的結果
- 12. 基於Solr的搜索引擎入門
- 13. 搜索引擎
- 14. Solr的搜索,而索引
- 15. Solr可以在重新索引時提供搜索服務嗎?
- 16. 在搜索引擎中自動搜索
- 17. 我們可以直接將WARC文件索引到Solr嗎?
- 18. 可以使用SKOS的搜索引擎?
- 19. JQGrid&搜索引擎索引
- 20. 在txt文件中的PHP搜索引擎
- 21. 如何使用搜索:搜索API在txt文件中搜索?
- 22. 比較:DB全文搜索,以搜索引擎(Lucene的)
- 23. 爲什麼沒有搜索引擎可以搜索〜符號?
- 24. do solr-4.3.1可用於hbase-0.94.6.1中的索引搜索嗎?
- 25. 我可以使用Sphinx Search來創建元搜索引擎嗎?
- 26. 我可以創建自定義[視頻]搜索引擎嗎?
- 27. SOLR索引和搜索?
- 28. 沒有索引的Solr全文搜索?
- 29. 搜索引擎中的倒排索引
- 30. 是否可以/明智地不鏈接索引中的任何頁面? (搜索引擎優化,搜索引擎)
數據如何存儲在txt中?逗號分隔? – sidgate