我有一個csv文件,其內容全部是中文(標題除外)。因爲我想讀取文件作爲字典(其中欄標題是關鍵),我做了以下內容:如何閱讀python中的utf-8 csv中文文件
import csv
d = csv.DictReader(open('file.csv', 'rU')
final = []
for row in d:
final.append(row)
但是,當我嘗試訪問的值,該值被各個擊破,並顯示了這樣的:
'\xe4\xb8\x8a\xe6\xb5\xb7\xe5\xba\xb7\xe8\xa1\x8d\xe6\x8a\xa4\xe7\x90\x86\xe7\xab\x99'
因此file.csv
是一個UTF-8 csv文件(最初由Excel製作並保存爲xlsx,後來保存爲csv文件)。我如何在Python 2.7中讀取這個文件?
嗨,我試過my_byte.decode('utf8'),但我得到的結果是'u4e0a \ u6d77 \ u5eb7 \ u884d \ u62a4 \ u7406 \ u7ad9',這是對的嗎? – song0089
@ song0089是的,這是一個unicode字符串的repr。然後,您可以在使用文本的任何地方使用它。如果你打印到終端,它應該顯示爲中文字形,如果你有它的GUI,它應該爲用戶提供正確的東西,等等。 –
https://nedbatchelder.com/text/unipain.html –