是否有任何可用於將MSWord .doc/.docx文件轉換爲純文本格式的c/C++開放源代碼庫?.doc to plain text轉換器
4
A
回答
3
1
我不知道該任務的庫,但也許你可以從Antiword提取重要位。不過,我不確定Antiword是否處理docx。
2
2
如果一切都失敗了,.docx文件實際上是一個ZIP文件,其中有幾個目錄。其中一個目錄中的其中一個文件具有文檔文本,如帶有標記的XML。有一些標籤必須處理,因爲它們標記行結束,但其中大部分標記標記自動更正標記各種東西的位置,或者標記格式化的隨機分佈的5層深嵌套標記。
(我不得不用手一次的機器上沒有上網要做到這一點,有人保存的文件與Office 2011,並希望在朋友的地方在boonies打開它在Office 2005左右。)
相關問題
- 1. HTML to PDF/rtf/doc/etc轉換器?
- 2. html to .doc轉換器在Python?
- 3. C#。 Doc to PDF轉換
- 4. text/plain vs text/javascript
- 5. Markdown to text/plain和text/html多部分電子郵件
- 6. .htaccess AddType plain/text
- 7. numpy bytes to plain string
- 8. PDF到DOC/DOCX轉換器
- 9. restFixture LET for text/plain
- 10. 使用SAPI轉換Speech-to-Text
- 11. Apache將jsp頁面錯誤地轉換爲「text/plain」
- 12. WSO2 CONTENT_TYPE =「text/plain」沒用?
- 13. Angular.js template to plain html
- 14. MVC6 Web Api - Return Plain Text
- 15. text/css作爲text/plain傳輸
- 16. libmagic。 text/plain代替文本/ javascript text/css
- 17. text/plain和text/html與c + +郵件
- 18. 對JavaScript使用type =「text/plain」?
- 19. application/plain MIME type for text?
- 20. EWS body plain text使用F#
- 21. doc/docx to postscript/ps
- 22. maven hudson doc to pdf
- 23. .doc to pdf using python
- 24. Gson to Plain舊Java對象(POJO)
- 25. HQL to SQL轉換器
- 26. Winnovative HTML to PDF轉換器
- 27. QBO3 XML to JSON轉換器
- 28. PDF to JPG轉換器
- 29. 的LINQ to XML轉換器
- 30. Flex to Html/Ajax轉換器
邁克爾佩林或莎拉帕林? – 2011-12-21 12:44:33
@Paul Michael Palin。總是。 – Bojangles 2011-12-21 12:51:05
http://blog.stackoverflow.com/2010/11/qa-is-hard-lets-go-shopping/ – 2011-12-21 12:52:53