2015-08-22 254 views
-1

我正在研究文件搜索引擎的功能。我需要你的建議來設計我的應用程序。 我使用elastisearch作爲框架來實現我的功能。如何實現文件搜索功能?

我的主要功能是根據文件名,文件類型,大小和創建日期啓用文件搜索。我還需要啓用基於文件內容的搜索。

請建議什麼是最好的文件做索引和提取文件數據。

此外,由於文件可以刪除/更新,所以我需要在一段時間內再次生成索引,所以我如何監視目錄中的任何更改。

我使用SAMBA作爲我的文件存儲系統。

回答

1

要在文件內容中具有搜索選項,您需要將文件索引到elasticsearch索引中。

查看Mapper Attachment插件,這將幫助您索引文件並使其可搜索。

Step01:安裝插件到您的elasticsearch集羣

步驟02:轉換的文件作爲字節[],並把它交給elasticsearch指數

步驟03:現在您可以使用普通查詢使用文件內容進行搜索。

注意:這隻適用於基於文本的文件,如pdf,word(doc,docx)&文本文件。如果PDF文件包含圖片中的文字,則無法搜索。

+0

我安裝了Mapper Attachment插件。我正在按照下面的URL中提到的步驟來測試一次功能。 http://www.elasticsearch.cn/tutorials/2011/07/18/attachment-type-in​​-action.html
我能夠創建索引,但我的搜索功能無法正常工作。當我運行以下URL -
curl「localhost:9200/_search?pretty = true」-d'{字段「:[」title「], 」query「:{ 」query_string「:{ 」query 「: 」放大器「 }} , 」亮點「:{ 」田「:{ 」文件「:{}} } } 」
這個返回我總點擊數爲0 –

+0

能否請您移動你的代碼給git hub併爲我提供URL,這樣我就可以測試相同的並告訴你原因... –

相關問題