Python3.x，熊貓，CSV，UTF-8的錯誤

我試圖用大熊貓並獲得以下錯誤消息導入數據集：Python3.x，熊貓，CSV，UTF-8的錯誤

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa0 in position 10: invalid start byte

我讀到編碼，並試圖把它作爲

df=pd.read_csv("file.csv",encoding="ISO-xxxx")

它顯示錯誤爲無效語法。

我分享鏈接到我的數據，如果你們想看看：https://www.kaggle.com/venkatramakrishnan/india-water-quality-data

來源

2017-06-12 Kushagra Jalota

您可以顯示「無效語法」錯誤的追蹤？ – lenz

請將該數據集修剪至再現問題的最小數據集，然後將其編輯到問題中。如果刪除上半部分或下半部分，問題是否仍然存在？它可以縮小到一行嗎？除非問題本身能夠顯示問題，否則問題就會脫離主題，因爲我們希望問題能夠在未來得到證明（在您從外部刪除/修改文件之後）。 – halfer

無效語法錯誤現在被刪除，我檢查了回溯並自行解決。 –

import pandas as pd 

df = pd.read_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1')

上面的代碼寫在蟒蛇3.6和大熊貓「0.20.1解決方案之一'。

爲什麼會出現此問題？

There are some special character which by default utf-8 is cannot be used to decode. if you have the raw data,try making the csv using pandas with the following code:

df.to_csv('IndiaAffectedWaterQualityAreas.csv',encoding = 'latin-1')

來源

2017-12-14 07:19:39

Python3.x，熊貓，CSV，UTF-8的錯誤

回答

相關問題