0
我相對來說是一個大數據處理的新手,從SO社區尋找一些特定的指導。單片ETL到分佈式/可伸縮解決方案和OLAP立方體到Elasticsearch/Solr
我們目前正在設置單片/順序ETL,不用說隨着數據的增長它不可擴展。我們有什麼選擇(確保分發和並行化,但需要具體說明)?我已經玩過Hadoop,可能適合在這裏使用,但我想知道那裏有哪些其他選項?可能更容易轉換爲數據庫開發人員?
與上述問題相關的一種情況是,我們還有一個用於彙總數據的OLAP多維數據集。 Elasticsearch或Solr是替代OLAP多維數據集的良好候選者嗎?有沒有人成功地做過這件事什麼是陷阱?