爲了減少配置時間,我們決定繼續使用5個實例的專用EMR集羣(我們預計需要大約5個實例)。如果我們需要更多,我們認爲我們需要實施某種自動縮放。Autoscaling EMR-是否需要?我應該只使用EC2嗎?我應該只使用Qubole嗎?
我對EMR並不陌生,它支持自動縮放嗎?我在文檔中找到了這個:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-manage-resize.html
這是尋找自動縮放的正確位置,還是我誤解了「調整大小」的含義?我讀過EMR的一個好處是「按需處理」,我認爲它會分割ec2實例之間的負載,而不用指定多少實例,所以這給我的印象是它自己對ec2實例進行縮放,這意味着我們不需要自行擴展自己。我誤解了「按需處理」是什麼意思?
如果我提供的調整大小鏈接適合我正在嘗試做的事情,有沒有人有經驗確定時要調整大小?該文檔僅描述瞭如何但不是,例如,如何警報何時調整大小。我使用了他們的常規自動縮放服務,它允許您根據特定的條件調整大小,但我在這裏沒有看到它。我還不確定自動縮放EMR是否是一個壞主意 - 它是否涉及太多(因爲像Qubole這樣的整個公司都提供這種功能),或者可能不是很有用,因爲EMR已經使用了它需要的任何計算能力?我對EMR實際提供的東西不太瞭解,所以也許這就是我困惑的原因。
我可以證實這一點。雖然看起來EMR正朝着提供智能自動縮放的方向發展,但Qubole似乎在這方面有一些先發優勢。他們的UI(或API)爲您提供配置點,以便在羣集的最小和最大大小以及成本邊界上設置邊界。您可以使用試用帳戶(https://api.qubole.com/users/sign_up)快速測試它,只需登錄,配置您的AWS令牌,並且如果您需要示例數據,請在以下位置查找它:s3://paid-qubole/default-datasets/- 可能需要不到一小時的時間來設置您的測試。 – agentv 2015-08-03 00:46:58