0
我有一個非常大的多千兆字節文件,其成本太高,無法加載到內存中。但是,文件中行的排序不是隨機的。有沒有辦法使用類似fread的行來讀取行的隨機子集?R:使用fread或同等文件從文件中隨機讀取行嗎?
像這樣的東西,例如?
data <- fread("data_file", nrows_sample = 90000)
這github post表明一種可能性是做這樣的事情:
fread("shuf -n 5 data_file")
這不適合我,但是。有任何想法嗎?