2014-01-19 66 views
37

我有很大的.csv文件,大約有幾GB,我想先讀幾千行。有沒有辦法做到這一點?如何將前1000行的.csv文件讀入R?

+0

http://stackoverflow.com/questions/3094866/trimming-a-huge-3-5-gb-csv-file-to-read-into-r?rq=1 –

+0

我反覆提到這個問題時尋找如何解決同樣的問題。我希望在readr read.csv等中看到解決方案。從命中次數,upvotes和收藏夾中,我認爲重新打開這個問題會很有幫助嗎? – pluke

回答

55

使用nrows論點read.csv(...)

df <- read.csv(file="my.large.file.csv",nrows=2000) 

還有一個skip=參數告訴read.csv(...)多少行,你開始閱讀之前要跳過。

如果你的文件很大,你最好在data.table包中使用fread(...)。相同的論點。

+0

如果第一行是列名稱的行,那麼'skip'不是很有用。 –

+1

@MatthewLundberg在這種情況下,你可以用n = 1掃描(第一行),然後用'skip ='使用'read.csv'並在其後添加。 –

13

如果你是在UNIX或OS/X,你可以使用命令行:

head -n 1000 myfile.csv > myfile.head.csv 

然後,只需看它像正常R上。