存儲數據的簡單方式我有一個Python腳本,做了沿着線:從多個進程
def MyScript(input_filename1, input_filename2):
return val;
即每對輸入的,我計算某些浮點值。請注意val是一個簡單的double/float。由於這種計算非常密集,我將跨越不同的進程(可能在同一臺計算機上,可能在多臺計算機上)運行它們。
我之前做的是我輸出這個值到一個文本文件:input1_input2.txt。然後,我將有1000000個文件,我需要將其縮減爲一個文件。這個過程不是很快,因爲操作系統不喜歡文件太多的文件夾。
如何將所有這些數據有效地存入一臺計算機?也許讓MongoDB在計算機上運行並且所有進程都會一起發送數據?
我想要簡單的東西。我知道我可以在MPI中做到這一點,但我認爲對於這樣一個簡單的任務來說是過度的。