2011-07-14 84 views
0

我的公司收集了大約3500種高度結構化的Word文檔(並不斷增長),其中包含來自我們產品的多項選擇題。我一直致力於編寫一個前端,讓人們可以在其他產品中找到並使用這些前端。有一些元數據放在數據庫中,但我們也想要全文搜索。RAILS3:全文搜索Word文檔?

我已經給出了使用前端MS Access(因爲我知道它)或Rails(因爲我應該學習它)的選項。我已經完成了一個Rails應用程序,並希望繼續它。

與其將數據庫中的文件加載到,我認爲將它們放在文件系統上並在數據庫中存儲它們的路徑更有意義。

我知道我可以使用Ferret搜索數據庫字段,但是爲文件系統上的一堆文件添加全文搜索到Rails應用程序的最佳方法是什麼?

回答

0

不確定是否有任何寶石會爲您搜索單詞文件。雖然你已經提到你不想將整個文檔加載到數據庫中,但你可能會考慮複製你的數據庫中每個文件的文本內容。你可以使用win32ol庫來執行此操作(http://ruby-doc.org/stdlib/libdoc/win32ole/rdoc/classes/WIN32OLE.html)。如果我必須執行此操作,我將每天晚上運行一個cron作業(或任何頻率似乎適合),這將刷新數據庫內容與word文件的變化。

+0

感謝您的回答,Aniket! 我想我真的正在考慮一個好的搜索引擎,它會索引這些文件,然後在我的Rails應用程序中與索引進行交互以找到並顯示匹配。我們很快會召開會議,討論如何做到這一點的最佳方式,這樣一切都在空中。我可能最終將內容放入數據庫字段中。 –