2017-09-20 35 views
0

每當在其各自的程序中打開一個MS字(或LibreOffice或其他文字處理程序)文檔時,這些字通常顯示在頁面上,但在文本編輯器中打開該文檔時,大部分是Unicode亂碼。爲什麼不將文字處理程序文檔存儲爲純文本?

我可以理解爲什麼文檔可能有一些不可讀的部分,比如項目符號點或元數據,但爲什麼至少某些內容不是以明文形式存儲的?每個字母都被編碼了嗎?

回答

1

Microsoft Word的最後一種格式docx是一個帶有zip壓縮的純文本格式的XML文件。您可以通過將docx重命名爲zip來解壓文件,然後用記事本打開文件。所以它被部分存儲爲純文本壓縮。

0

我發現它可能是品牌的東西。如果你想要,你可以將它導入到文本文件。

如果您轉到文件>導出>更改文件類型>純文本(* .txt),您可以將文檔導出到那裏。

相關問題