有人可以告訴我從哪裏開始爲本地文件開發一個簡單的全文本搜索引擎嗎?如何開發一個簡單的搜索引擎在本地文件中進行全文搜索
我有一臺帶有LAMP的Debian 7服務器,並在其上安裝了一個Windows網絡驅動器。到目前爲止,我正在使用this script向其他本地網絡用戶顯示他們可以從裝入的網絡驅動器下載文件的目錄樹。
但我必須建立一個簡單的搜索引擎,可以索引掛載文件夾中的本地文件的名稱和內容(如果有) - Microsoft doc,docx,xls,xlsx,rtf,txt。搜索必須返回文件的名稱,路徑和最好的文本是否存在搜索詞出現的部分(如果文件有文本)。
難道有人指向我正確的方向,我必須閱讀和學習如何做到這一點?謝謝。
感謝我會看的文檔。你有使用elasticsearch的經驗嗎? – ispasov
當然,有些。不知道你爲什麼問,雖然... – femtoRgon
我只是想知道,如果你讓我代表你的經驗這些解決方案之間的一些comparizon。 – ispasov