這是一個以前question,其中以改善功能的蟒蛇時的表現我需要找到一種有效的方式來分割我的文本文件Efficent方式蟒蛇
來分割大文本文件我有以下的文字文件(超過32 GB)沒有排序
....................
0 274 593869.99 6734999.96 121.83 1,
0 273 593869.51 6734999.92 121.57 1,
0 273 593869.15 6734999.89 121.57 1,
0 273 593868.79 6734999.86 121.65 1,
0 272 593868.44 6734999.84 121.65 1,
0 273 593869.00 6734999.94 124.21 1,
0 273 593868.68 6734999.92 124.32 1,
0 274 593868.39 6734999.90 124.44 1,
0 275 593866.94 6734999.71 121.37 1,
0 273 593868.73 6734999.99 127.28 1,
.............................
所述第一和第二列是ID(例如:0 -273)的X,Y,Z中的網格點的位置的。
def point_grid_id(x,y,minx,maxy,distx,disty):
"""give id (row,col)"""
col = int((x - minx)/distx)
row = int((maxy - y)/disty)
return (row, col)
的(minx, maxx)
是我的網格大小爲distx,disty
起源。標識牌的數量是
tiles_id = [j for j in np.ndindex(ny, nx)] #ny = number of row, nx= number of columns
from [(0,0),(0,1),(0,2),...,(ny-1,nx-1)]
n = len(tiles_id)
我需要切片〜32 GB的文件中n (= len(tiles_id))
數量的文件。
我可以做到這一點沒有排序,但閱讀n次文件。由於這個原因,我希望從(0,0) (= tiles_id[0])
開始的文件找到一個有效的分割方法。之後,我只能讀取一次分割的文件。
如何不使用python? – 2013-03-05 15:13:52
我愛Python! – 2013-03-05 15:14:26
不知道如何真正用Python來排序該文件的大小。 – 2013-03-05 15:15:04