2016-07-08 54 views
2

我嘗試寫入文件numpy.ndarray。 我用寫numpy.ndarray與俄文字符到文件

unique1 = np.unique(df['search_term']) 
unique1 = unique1.tolist() 

和明年嘗試 1)

edf = pd.DataFrame() 
edf['term'] = unique1 
writer = pd.ExcelWriter(r'term.xlsx', engine='xlsxwriter') 
edf.to_excel(writer) 
writer.close() 

和2)

thefile = codecs.open('domain.txt', 'w', encoding='utf-8') 
for item in unique: 
    thefile.write("%s\n" % item) 

但是,所有返回UnicodeDecodeError: 'utf8' codec can't decode byte 0xd7 in position 9: invalid continuation byte

+0

你的意思的標題是*寫numpy.ndarray有** **俄羅斯字符到文件*?目前,有一個* u *缺失,這使得通過僅查看標題很難理解您要求的內容。 –

回答

0

第二個例子,如果你編碼應該工作字符串爲utf8。

在Python2以下工作與UTF8編碼的文件:

# _*_ coding: utf-8 

import pandas as pd 

edf = pd.DataFrame() 
edf['term'] = ['foo', 'bar', u'русском'] 

writer = pd.ExcelWriter(r'term.xlsx', engine='xlsxwriter') 
edf.to_excel(writer) 

writer.save() 

輸出:

enter image description here