我使用MAPI工具(其微軟lib和.NET中),然後阿帕奇TIKA庫來處理和從Exchange Server,提取PST這不可擴展。如何處理/提取的.pst USIG的Hadoop地圖降低
如何使用MR方式處理/提取pst ...是否有任何工具可用於Java,我可以在MR作業中使用它。任何幫助都會很棒。
Jpst庫內部使用:PstFile pstFile = new PstFile(java.io.File)
而且問題是Hadoop的API的我們沒有任何接近java.io.File
。
以下選項是永遠存在的,但效率不高:
可能不是... –
要做到這一點在的Map/Reduce的方式,你需要能夠分裂PST文件分成小塊,所以單個節點可以處理它們的部分。我不確定PST文件格式是否支持? – Gagravarr