2017-06-12 80 views
0

我試圖用大熊貓並獲得以下錯誤消息導入數據集:Python3.x,熊貓,CSV,UTF-8的錯誤

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa0 in position 10: invalid start byte

我讀到編碼,並試圖把它作爲

df=pd.read_csv("file.csv",encoding="ISO-xxxx") 

它顯示錯誤爲無效語法。

我分享鏈接到我的數據,如果你們想看看:https://www.kaggle.com/venkatramakrishnan/india-water-quality-data

+0

您可以顯示 「無效語法」 錯誤的追蹤? – lenz

+1

請將該數據集修剪至再現問題的最小數據集,然後將其編輯到問題中。如果刪除上半部分或下半部分,問題是否仍然存在?它可以縮小到一行嗎?除非問題本身能夠顯示問題,否則問題就會脫離主題,因爲我們希望問題能夠在未來得到證明(在您從外部刪除/修改文件之後)。 – halfer

+0

無效語法錯誤現在被刪除,我檢查了回溯並自行解決。 –

回答

0
import pandas as pd 

df = pd.read_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1') 

上面的代碼寫在蟒蛇3.6大熊貓「0.20.1解決方案之一'

爲什麼會出現此問題?

There are some special character which by default utf-8 is cannot be used to decode. if you have the raw data,try making the csv using pandas with the following code:

df.to_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1')