我有一個包含英文單詞的文本文件「words.txt」。假設它只包含三個詞:「一」,「二」和「三」。 我也有三個文件:one.dat,two.dat和three.dat。這些文件中的每一個都包含表示相應單詞轉錄的二進制數據格式是UTF-8。 我想要什麼:我想將「words.txt」和所有這些.dat文件合併成單個文檔,以便能夠打印。所以,我需要這樣的事(讓它命名爲 「final.dat」):蟒蛇聚集ascii和utf-8的東西
一個[萬] 2個[TU:] 3 [RI:]
但正確的 「日」 的標誌代替 」?」 :)
最重要的是我必須能夠將「final.dat」加載到MSWord或Writer中並打印出來。
我要去蟒蛇來完成它,但我真的卡住了所有這些「編解碼器」,「編碼」,「解碼」等等......
如果他們有二進制數據,那麼你沒有UTF-8。反之亦然。 UTF-8不再是比ASCII更多的二進制數據。兩者都是文本數據。 – tchrist