2015-01-06 35 views

回答

1

你可以嘗試Apache Tika

阿帕奇提卡™工具包檢測和超過一千不同的文件類型(如PPT,XLS和PDF)提取元數據和文本。所有這些文件類型都可以通過單個界面進行分析,這使得Tika對於搜索引擎索引,內容分析,翻譯等等非常有用。

相關問題