0
Q
閱讀大數據子集
A
回答
0
可以使用read.csv
不過濾行。您可以嘗試sqldf::read.csv.sql
,如答案to this question中所述。
但我想大多數人會先使用其他工具處理文件。例如,csvkit允許按行進行過濾。
相關問題
- 1. 閱讀大型數據集大熊貓
- 2. 閱讀數據集
- 3. 閱讀數據集
- 4. 閱讀1GB大小excel與1.5記錄每張到數據集
- 5. 閱讀CSV與大熊貓有這種數據集
- 6. 性能閱讀大型數據集從多個並行線程
- 7. 閱讀R中的複雜數據集
- 8. 閱讀HDF5數據集與熊貓
- 9. 閱讀3維數據集成R
- 10. 閱讀MNIST數據集使用F#
- 11. 如何讀取R中大數據集的子集?
- 12. 閱讀/寫入大量數據
- 13. 子集大數據幀
- 14. Android - Firebase |閱讀所有的子數據
- 15. CSVGREP子集大型數據集
- 16. 閱讀grib2數據
- 17. 閱讀excel數據
- 18. 閱讀Json數據
- 19. 閱讀firebase數據
- 20. 閱讀從asp.net web api返回的任意數據集數據
- 21. NSInputStream閱讀:最大長度:無法讀取數據,返回-1
- 22. 如何高效地搜索子數據集的大數據集?
- 23. 用R表示大數據集中數據幀的子集
- 24. 閱讀大文件
- 25. 訂閱大集合
- 26. BufferedReader閱讀Json數據
- 27. 閱讀TIFF柵格數據
- 28. 閱讀文本數據
- 29. 閱讀分塊數據
- 30. 閱讀與像數據庫
如果您知道它們在哪裏(並且它們在一起),則可以使用'read.csv'的'skip'和'nrows'參數。如果你不知道,那麼'grep'可能是有序的。 – alistaire
如果你真的想把它全部保存在R中,可以很容易地以批處理的方式讀取文件(有多少實際取決於可用的內存),使用'lapply',按照你需要的進行子集分類,事實之後的很多。儘管如此,您可能希望使用'data.table :: fread'或'readr :: read_csv'來實現速度,但它仍然不是最快的方法,因爲它會執行大量的過度處理。儘管如此,稍微優化它並不會那麼困難。 – alistaire