2016-12-30 74 views
0

我有一個文件中包含日文文本的Unicode字符,我想從文件中讀取Unicode並寫入相應的非-Unicode字符(字符串)到另一個文件中。如何從文本文件中讀取unicode並使用Python將各自的字符串寫入exel文件中

Unicode的文件中是這樣的:

\u6C0F\u540D 
\u7BA1\u7406\u8005\u540D 
\u4F4F\u6240 
\u96FB\u8A71\u756A\u53F7 
\u30E1\u30FC\u30EB\u30A2\u30C9\u30EC\u30B9

其實,我想要以這個unicode,它由提到的Unicode的非Unicode字符的Excel文件。

+0

你的代碼是什麼樣的? –

回答

1

如果你有一個包含以下內容稱爲japanese.txt文件:

\u6C0F\u540D 
\u7BA1\u7406\u8005\u540D 
\u4F4F\u6240 
\u96FB\u8A71\u756A\u53F7 
\u30E1\u30FC\u30EB\u30A2\u30C9\u30EC\u30B9 

你可以把它添加到一個Excel與openpyxl文件,使用下面的代碼:

# -*- coding: utf-8 -*- 

from openpyxl import Workbook 
import codecs 

with codecs.open('japanese.txt', 'r', encoding='utf8') as file: 
    s = file.read() 

s = s.decode('unicode-escape') 

wb = Workbook() 

ws = wb.active 

ws['A1'] = 42 

ws.append([1, 2, 3]) 

import datetime 
ws['A2'] = s 

wb.save("sample.xlsx") 
+1

感謝您的解決方案..我一直在爲解決方案而撓撓頭腦。謝謝了很多.. –

0

它似乎有一個包可以爲你工作叫unidecode。它會很容易做到這一點。例如:

>>> from unidecode import unidecode 
>>> print(unidecode(u"\u6C0F\u540D")) 
Shi Ming 
相關問題