我想了解如何在Word文檔打開時重建Word文件,以及在保存編輯和關閉文件時以何種格式對它們進行序列化。你可能有任何信息對我非常有用?謝謝是否所有MS Word文檔都以XML可讀格式進行序列化?
回答
所有.doc文件存儲在binary format。打開和操作這些是PAIN的練習。
所有.docx文件實際上是以ZIP格式存儲的XML文件的集合。沒錯,只需將.docx或.xmlx或.pptx的擴展名更改爲.ZIP,就可以像打開其他任何ZIP文件一樣打開文件。 MS甚至有一個稱爲Office Open XML的格式的API。就我個人而言,我認爲OOXML API具有相當陡峭的學習曲線,當我傾向於製作Word文件或以其他方式操作它們時,我只需製作一個示例文件,解壓縮它,然後操作其內部。海事組織的OOXML文件的基礎知識很簡單,足以使用沒有一個大的舊API ...
是所有的MS Word文檔序列化爲XML可讀格式?
簡答:沒有。
長答案:每發佈一次,MS都會更改word文檔的格式。因此Word 6.0到95使用格式,Word 97到2002(又名XP)使用另一個,2003另一個,而2007又是另一個。
當然,每個版本都可以以舊格式保存和打開文檔(雖然新功能通常無法保存在這些較舊的格式中)。
截至2003年(.doc)的格式是以前版本的增量升級,並且是基於二進制的。
與Office 2007中引入格式文件(.docx)是基於XML的,並被迫爲ISO標準「ISO/IEC 29500:2008的Office Open XML」,雖然這個詞本身是不是該標準完全兼容。請注意,Word 2007仍然可以以舊的二進制格式保存(並打開)文檔。
希望這會有所幫助。
非常感謝,它確實有幫助,雖然它看起來比我希望的更復雜! – ComethTheNerd 2010-04-18 22:35:10
- 1. 是否可以搜索Word文檔並返回所有表格?
- 2. MS-MS Word文本格式化寶石
- 3. MS Word ActiveX控件 - 是否可以訪問打開的文檔?
- 4. 是否可以將XSLT樣式表添加到序列化的XML文檔中?
- 5. MS Word以XML格式拆分單詞
- 6. c#應用程序設置是否可以以XML(protobuf-net)之外的格式進行序列化?
- 7. 以只讀模式打開word文檔
- 8. 是否可以使用XSLT對XML文檔進行顏色編碼和格式化?
- 9. XSLT格式化XML文檔
- 10. 序列化XML文檔
- 11. 使用php讀取帶有圖像的Ms文檔word文檔
- 12. Word 2010中 - 強制格式化文檔
- 13. 是否可以爲由POI庫創建的word文檔定義xml模式?
- 14. XML序列化 - 是否可以用這種方式序列化模型?
- 15. 是否可以將Word文檔轉換爲Google文檔?
- 16. 序列化到XML文檔
- 17. MS Word - 可以添加嵌入式文檔?
- 18. PHP閱讀「Unicode」MS Word文檔
- 19. 閱讀UWP中的MS WORD文檔
- 20. 讀/寫/保存MS Word文檔在c#
- 21. 通過Word文檔循環以格式化文本
- 22. 以人類可讀的文本格式序列化
- 23. 是否可以在.net中執行「混合」XML序列化?
- 24. 是否可以使用XSD的相同格式序列化爲XML?
- 25. 如何以編程方式與打開的MS Word文檔進行交互
- 26. 閱讀形式在MS Word文檔中的文字
- 27. 從Word文檔的所有空格中刪除格式
- 28. 是否可以使用XSL對XML文件進行排序?
- 29. 是否可以在.vbs腳本中進行序列化?
- 30. 是否可以使用序列化屬性進行關聯?
謝謝你給我一個很好的起點,試驗簡單的單詞文件。我肯定會看到它,現在我有一些想法! – ComethTheNerd 2010-04-18 22:29:53