我有一個csv文件是通過將Tableau表導出到csv生成的,但我無法設法在Python中打開它。讀取csv文件到熊貓失敗
我試圖使用pd.read_csv但失敗。
import pandas as pd
#path to file
path = "tableau_crosstab.csv"
data = pd.read_csv(path, encoding="ISO-8859-1")
這適用於文件中讀取,但結果只是一個數字,每行一個字符,並在幀的頭部一些奇怪的字符行。
ÿþd
o
m
a
i
等等。當我嘗試導入Excel中的文件,我必須選擇選項卡作爲分隔符,但是當我索引樹,在這裏它失敗
import pandas as pd
#path to file
path = "tableau_crosstab.csv"
data = pd.read_csv(path, encoding="ISO-8859-1", sep='\t')
CParserError:錯誤符號化數據。 C錯誤:第7行預計1字段,鋸2
我曾嘗試打開帶有編解碼器的文件,然後它說編碼是'cp1252',但使用它作爲編碼也失敗了。
我也嘗試使用utf-8來閱讀它,並且也失敗了。 我正在想出如何解決這個問題。
下面是其中一個副本,如果該文件是,如果有人可以看看鏈接 http://www.mediafire.com/file/6dtxo2deczwy3u2/tableau_crosstab.csv
它的工作對我來說太。謝謝!所以從看看你能明白編碼是'utf-16'? – Siesta
是的,如果你看維基百科頁面:https://en.wikipedia.org/wiki/Byte_order_mark#Byte_order_marks_by_encoding,你會看到十六進制值和顯示的字符,你習慣看到這些並在一段時間後識別它們 – EdChum