假設我在獨立的excel文件中有大量獨立的數據集。hadoop map reduce vs clojure pmap函數
就運行效率而言,使用clojure Pmap函數處理數據還是使用hadoop map reduce會更好?
每個excel文件至少包含約34000行,我有相當數量的它們。
對不起,初學者的問題,因爲我是比較新的都和他們正在做的研究
正如你們中的一些人已經解釋,
也許有更多的問題是要比較的例子Clojure的PMAP運行同一份軟件的多個實例,這些差異有哪些?
我能想到的唯一的事情就是PMAP可以採取的變量任何金額然而,閱讀每個應用實例一個文件需要的文件數量被稱爲前期和實例初始化
參見:[我需要SQL或Hadoop?流程圖](http://www.aaroncordova。com/2012/01/do-i-need-sql-or-hadoop-flowchart.html) - s/SQL/pmap/ – noahlz