是否有內置的方式可以使用read_csv
在不知道提前行長的情況下只讀取文件的第一行n
?我有一個需要很長時間閱讀的大文件,偶爾只需要使用第一行,例如20行來獲取它的一個樣本(並且不想加載完整的內容並將它放在頭上)。讀取大熊貓數據幀的前幾行的方法
如果我知道我可以做類似footer_lines = total_lines - n
的行的總數並將其傳遞給skipfooter
關鍵字arg。我目前的解決方案是將第一n
線,Python和StringIO的手動將其搶來的大熊貓:
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
這並不是說不好,但有一個更簡潔,「pandasic」的方式與關鍵字做到這一點(?)或者其他的東西?
要了解如何加載最後的_N_行結帳[this SO post](http://stackoverflow.com/questions/17108250/efficiently-read-last-n-rows-of-csv-into-dataframe) – zelusp 2016-09-27 03:09:09
你的意思是「pandastic」嗎? :) – 2018-01-15 07:08:22