2012-12-03 54 views
0

所以我的情況是封閉的電子郵件系統。哪個工具更適合存儲啓用html的文本(封閉的電子郵件系統)?

該電子郵件已啓用HTML。

需要什麼樣的:
全文搜索(有超過1萬封電子郵件數據庫中,但它們通常是預過濾的基礎上,最近一次活躍用戶)
歸檔 - 我如何存檔電子郵件,年齡大於1-2歲。

哪一種更好的方式來保存這些電子郵件?作爲服務器上的文件或數據庫表中的文件。還是兩者的結合(歸檔)?

上述問題後 - 我可以使用哪些特定工具/插件來簡化工作。我記得聽說過Solr,但我不確定其他選擇/可能性。

回答

0

Solr會幫助您在搜索方面,但與歸檔無關。看看Solr DIH,有一個讀取IMAP源的contrib模塊(我認爲)。

關於存檔,這是一個非常大的面積......有很多問題,你必須回答:

  • 要存儲的郵件作爲一個整體,或分解及其部件,所以你還可以重複數據刪除的部分是在不同的郵件中重複。
  • 我的偏向存儲上的文件系統,但要注意:
  • 你需要想出一個辦法,在顯示目錄樹來檢測重複數據刪除
  • 商店巧妙所以你不要放慢每個目錄瀏覽。
  • 敷在需要時(不小的或不可壓縮的)
+0

通過重複數據刪除你的意思是,如果電子郵件包含回覆文本?如果我想搜索檔案 - >這是一個壞主意嗎? – StanM

+0

我的意思是不存儲兩次相同的內容,想象同樣的附件發送給20個不同的人... – Persimmonium

+0

啊,是的附件是分開存儲。現在,我只想着解決大量電子郵件的方法(以及不可避免的使用html文本膨脹數據庫 – StanM

相關問題