我正在評估運行~20節點Hadoop集羣的EC2/EMR。 (custom JAR集羣)。我在單節點3.3 GHz 2GB RAM本地VMWare實例上運行簡單的WordCount示例,只需不到10秒即可完成。 WordCount示例需要3分鐘才能在EMR上完成,其中2個c1.mediumm實例(不包括啓動時間3-5分鐘)。同時爲2個m1.small實例。在EMR上運行工作會有一些開銷,也許這個問題的規模太小,所以這似乎是可以理解的。Elastic MapReduce(EMR)的縮放比例?
在您看到什麼尺寸問題後,您會發現雲的性能優勢?或者大約有多少個節點或計算單元?