2015-05-01 37 views
1

我有一批大約45 kb的500個文件。每個文件需要大約87840次計算(ARIMA迴歸問題)。而且每個計算都是獨立的。使用Map Reduce或多線程/多處理的小文件

鑑於此,爲此類問題開發解決方案的最佳方法是什麼。

彈性映射是否減少了走向,還是應該使用多核處理器和多線程?

回答

0

如果每個計算都是獨立的,那麼多線程將是一個糟糕的想法,因爲您遇到與此相關的共享堆和序列化問題。如此彈性的map-reduce或者只能訪問多核機器,然後使用多處理。

+0

如果EMR方法被改編,你能否告訴我們mappers和reducer在這種情況下會是怎樣的?我想以儘可能平行的方式處理500個文件。每個文件也有87840個獨立的計算完成,正如我在問題中提到的那樣。 – NightOwl85