我從以下書中例子Python的數據分析。特別是,從第9章開始的2012年選舉數據庫。數據位於一個大的csv文件中,用逗號分隔。但是文件的每一行都有一個額外的尾隨分隔符,這似乎混淆了pandas.read_csv
。蟒蛇大熊貓 - 尾隨分隔符混淆read_csv
它把多餘的分隔符,就好像有一個額外的列。所以還有一個比標題要求更多的列。然後pandas.read_csv
將第一列作爲行標籤。總體效果是,列和標題不再對齊 - 第一列變爲行標籤,第二列以第一個標題命名,等等。
這很煩人。任何想法如何告訴pandas.read_csv
做正確的事情?我找不到一個。
偉大的書,順便說一句。
很高興知道這本書有一個github回購。謝謝,韋斯。 – edwardw
我只是想說這個問題發生在其他地方。我剛剛從NOAA氣候網站下載了一些天氣數據,每個CSV文件的末尾都有一個逗號。我想出了與上面列出的相同的解決方法。這很煩人,並花了我一段時間來找出爲什麼read_csv()不起作用。 – user2072880