-4
2.6 GB,32位有符號整數的二進制文件,每行有100個元素。如何讀取Python,C或Java中的大數據文件的一部分?
我可以逐行讀取在Java中有:
DataInputStream dis = new DataInputStream(new FileInputStream("input.rawdata"))
for(int i = 0; i < 100; i++){
int idata = dis.readInt();
% DO THE NECESSARY TO LOAD idata IN A VARIABLE ARRAY %
}
dis.close();
但是,如果我想只讀第505行不讀最初的504線,那該怎麼辦呢?
或者如果數據是100 x 1000矩陣並且希望只讀取第15行至第80行的矩形&第100至第200列。那麼如何用上述三種語言中的任何一種來實現(最好是Python & Java)。
與代碼效率相關的建議非常受歡迎。
我想你想要MMAP? – vaultah 2014-09-20 07:02:42
閱讀'fseek()'並從中取出它。 – NPE 2014-09-20 07:14:13
二進制文件中行的含義是什麼? – 2014-09-20 09:12:03