我有很多不同版本的Word文檔,必須將其轉換爲文本文件。
我希望這個鏈接爲您帶來正確的方式 How to extract text from Word files using C#? 我想閱讀word文檔的內容並刪除所有格式(只是在文本文件中有文字)。我已經通過使用microsoft.office.interop(這裏,總是在客戶端實例化一個Word)完成,這是不推薦的。所以我想創建一個C#項目,它應該自動將單詞轉換爲文本。任何人都可以建議我任何第三方工具,應該是有效的開源或合理的價格的所有版本的單詞到文本文件在C#中的轉換?如何在不使用microsoft.office.interop的情況下將word文檔轉換爲c#中的文本文件?
與問候, Shanthini
我看希望看到回答了。 –
單詞只是皮膚下的xml文件。將.doc更改爲.zip並將其解壓並查看,但是您會在此處看到一個非常深的兔子洞。 – deltree
你想複製多少個文件?如果數量很大,那麼第三方可能會更好,但是如果不是,您可能需要查看文件撰寫器和Streamwriter,在其中複製word文檔,創建一個新的.txt文件並將該字符串粘貼到txt文件中。 –