2013-06-11 44 views
1

我有很多不同版本的Word文檔,必須將其轉換爲文本文件。
我希望這個鏈接爲您帶來正確的方式 How to extract text from Word files using C#? 我想閱讀word文檔的內容並刪除所有格式(只是在文本文件中有文字)。我已經通過使用microsoft.office.interop(這裏,總是在客戶端實例化一個Word)完成,這是不推薦的。所以我想創建一個C#項目,它應該自動將單詞轉換爲文本。任何人都可以建議我任何第三方工具,應該是有效的開源或合理的價格的所有版本的單詞到文本文件在C#中的轉換?如何在不使用microsoft.office.interop的情況下將word文檔轉換爲c#中的文本文件?

與問候, Shanthini

+0

我看希望看到回答了。 –

+1

單詞只是皮膚下的xml文件。將.doc更改爲.zip並將其解壓並查看,但是您會在此處看到一個非常深的兔子洞。 – deltree

+0

你想複製多少個文件?如果數量很大,那麼第三方可能會更好,但是如果不是,您可能需要查看文件撰寫器和Streamwriter,在其中複製word文檔,創建一個新的.txt文件並將該字符串粘貼到txt文件中。 –

回答

1

終於讓我找到解決方案的時刻,其完全爲我工作。我沒有測試10000個文件。在這裏,您去,http://sourceforge.net/projects/word-reader/?source=dlp 意見和建議都期待這個解決方案...

謝謝 Shanthini

+0

很遺憾,沒有附帶源代碼,即使它被託管在源代碼上 –

+0

如果你想用大量文件類型(不只是MSWord)來做到這一點,請參閱http://stackoverflow.com/a/41091943/495455 –

相關問題