我打算實施一個包含5臺機器的hadoop集羣。通過一些背景研究,我明白我需要在每臺機器上安裝hadoop以實現集羣。我可以使用hadoop發行版而不是手動安裝嗎?
早些時候,我打算安裝在每一個這些機器的Linux發行版,然後再單獨安裝的Hadoop,並配置每一臺機器並行工作。
最近我遇到了一些Hadoop發行版,例如Cloudera和Hortonworks。我的問題是,我應該在每臺機器上安裝Cloudera或Hortonworks等發行版,還是應該像前面描述的那樣單獨安裝hadoop?
使用分佈將使我的任務更容易,還是需要更多的知識來處理它們而不是純粹的hadoop安裝?
是的,它會讓你的生活更容易,如果您使用這些分佈的。 – climbage