我想只得到第一個100行具有在Python超過400萬行的csv.gz文件。我也想要了解每列的列數和標題。我怎樣才能做到這一點?打開Python中的csv.gz文件和打印前100行
我看着python: read lines from compressed text files找出如何打開文件,但我正在努力弄清楚如何實際打印前100行並獲得列中信息的一些元數據。
我發現這個Read first N lines of a file in python但不知道如何結婚打開csv.gz文件並閱讀它,而不保存未壓縮的csv文件。
我寫了這個代碼:
import gzip
import csv
import json
import pandas as pd
df = pd.read_csv('google-us-data.csv.gz', compression='gzip', header=0, sep=' ', quotechar='"', error_bad_lines=False)
for i in range (100):
print df.next()
我是新來的Python和我不明白的結果。我確定我的代碼是錯誤的,我一直在嘗試調試它,但我不知道要查看哪些文檔。
我得到這些結果(和它不斷下降控制檯 - 這是一個摘錄):
Skipping line 63: expected 3 fields, saw 7
Skipping line 64: expected 3 fields, saw 7
Skipping line 65: expected 3 fields, saw 7
Skipping line 66: expected 3 fields, saw 7
Skipping line 67: expected 3 fields, saw 7
Skipping line 68: expected 3 fields, saw 7
Skipping line 69: expected 3 fields, saw 7
Skipping line 70: expected 3 fields, saw 7
Skipping line 71: expected 3 fields, saw 7
Skipping line 72: expected 3 fields, saw 7
如果您知道[如何提問](http://stackoverflow.com/help/how-to-ask),您會得到更快的幫助。你寫了什麼代碼,它是如何使你失敗的? – CAB
好吧,我更新了我的帖子。想法? – SizzyNini
你可以發佈原始文件的樣子嗎? (例如,在終端中嘗試'頭文件') – moustachio