我愛熊貓,但我遇到了Unicode錯誤的實際問題。 read_excel()返回可怕的Unicode錯誤:python pandas read_excel返回describeDecodeError describe()
import pandas as pd
df=pd.read_excel('tmp.xlsx',encoding='utf-8')
df.describe()
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
...
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 259: ordinal not in range(128)
我想通了,原來的Excel曾在許多細胞年底 (不間斷空格),可能是爲了避免長數字串轉換爲浮動。
解決這個問題的方法之一是去除細胞,但必須有更好的東西。
for col in df.columns:
df[col]=df[col].str.strip()
我使用Win64的anaconda2.2.0,與大熊貓0.16
這個工作對我來說一次:DF [ 'somecol'] values.astype( '統一') https://github.com/pydata/pandas/issues/7758 – Gecko
幫自己一個大忙,並立即切換到python3。編碼問題全部在python3中解決。 – firelynx