2017-05-26 220 views
0

我試圖將Excel文件讀入pandas,但是我收到消息format and extension of the file don't match將csv文件讀取到熊貓

當我嘗試使用read_excel時,出現錯誤消息,因此我使用read_csv

這是問題所在;我的「Excel的像」文件中有一些行的空白單元格,並創建一個奇怪的東風,一些領域的轉移:

Image 1

我的代碼如下:

2010 = pd.read_csv(r'{0}\\file.xls'.format(path_temp),sep = 
r'\t*',encoding='iso-8859-2') 

在輸出中,列Outcome出現在第8行數據幀的第6(日期4)列中。您是否知道解決方法?我需要每15分鐘自動加載一次這個文件,這意味着我想避免手動打開並保存爲excel

+0

你可以發佈示例文件嗎?使用'read_excel'打開它時出現什麼錯誤信息? – EFT

+0

它表示不支持的格式或損壞的文件。預期轉爐等... – Jsfouf

+0

如果您在文本編輯器中打開它,它會是什麼樣子? – EFT

回答

0

您的分隔符是一個正則表達式。 sep=r'\t*'匹配任意數量的連續製表符,所以應將空白單元格視爲單個分隔符。改爲嘗試sep='\t'

+0

非常感謝,這對空單元格起作用!我 – Jsfouf

+0

我知道有一些單元格包含引號的內部問題。儘管使用了quotechar ='「'參數,那些----會創建一個換行符 這裏是我的代碼:pd.read_csv(r'{0} \\ DonneesIndisponibilitesProduction_2017.xls'.format(path_temp),delimiter = r'\ t',encoding ='iso-8859-2',quoting = csv.QUOTE_ALL,quotechar ='「') 我錯過了什麼嗎? – Jsfouf