2010-12-04 78 views
1

可以使用Microsoft Word自身支持的Word Interop打開任何文件格式嗎?在.NET中讀取文檔

我的任務看起來很簡單,我需要從任何常用文檔類型(基於內容的文檔比較)中讀取文本,只有文本。有沒有辦法比上面提到的Word Iterop更容易做到這一點?有沒有免費庫來做到這一點?或者打開任何(.doc,.docx,.pdf,.rtf,openoffice文檔等)文檔類型?我很忙,但還沒有找到太多的解決方案,而且我無法研究所有格式的800頁規格。

P.S .:分開處理PDF是好的,以及具有所有類型的庫。

回答

0

我工作的一個名爲Toxy新的框架。它的目標是從您提到的各種文檔中提取數據/文本。第一個版本將在明年初發布。(也許是2月)你可以在這裏找到一些實現:https://github.com/tonyqus/toxy。但現在還沒有準備好。