我可以讀取一個csv文件,其中有一列包含中文字符(其他列是英文和數字)。但是,漢字顯示不正確。見下文如何在熊貓數據框中顯示中文字符?
我裝csv文件與pd.read_csv()
照片。
display(data06_16)
或data06_16.head()
將不會正確顯示中文字符。
我試着將下列行添加到我的.bash_profile
:
export LC_ALL=zh_CN.UTF-8
export LANG=zh_CN.UTF-8
export LC_ALL=en_US.UTF-8
export LANG=en_US.UTF-8
,但它並不能幫助。
我也試圖encoding
ARG添加到pd.read_csv()
:
pd.read_csv('data.csv', encoding='utf_8')
pd.read_csv('data.csv', encoding='utf_16')
pd.read_csv('data.csv', encoding='utf_32')
這將無法工作。
如何正確顯示漢字?
您是否嘗試過'中文'語言的編解碼器 - 說'encoding ='gb2312'? –
謝謝。我嘗試了你建議的編碼,但是返回錯誤:'UnicodeDecodeError:'gb2312'編解碼器無法解碼位置2-3中的字節:非法多字節序列 – Daniel