實施一些解決方案,在我previous question後,從文本文件中刪除的項目,我已經想出了以下解決方案:幫助使用python
reader = open('C://text.txt')
writer = open('C://nona.txt', 'w')
counter = 1
names, nums = [], []
row = reader.read().split(' ')
x = len(row)/2
for (a, b) in [(c, d) for c, d in zip(row[:x], row[x:]) if d!='na']:
print counter
counter +=1
names.append(a)
nums.append(b)
writer.write(' '.join(names))
writer.write(' ')
writer.write(' '.join(nums))
這個程序工作得很好較小的樣本數據集。但是,當我使用完整的數據集並導致python崩潰時,它會凍結。關於如何克服這一點的任何建議?
請在Python崩潰時發佈stacktrace。它是否耗盡內存? – kobrien 2010-08-02 15:41:55
你可以讓python把它分解成10-20個臨時文件,然後調用腳本來處理每個文件。如果您的計算機具有多個內核,那麼這也將執行「多線程」。 – 2010-08-02 15:42:22
您是否考慮將數據轉換爲更標準的格式,如csv並從那裏使用它? – Wilduck 2010-08-02 15:43:39