我正在構建一個完整的「向外擴展」解決方案,以向我們的客戶提供深入的實時分析。Hadoop和分析?
客戶主要擁有多達200臺服務器,每臺服務器最多有400個會話正在進行,同時提供80000個會話。 我希望我可以提供會話分析,並使用BI工具(例如Tableau)提供圖形和查詢界面(基本上彙總查詢)。
我希望每個會話都是4分鐘長,並在4分鐘內觸發20個事件。每個事件可以是大約5個字段,主要是整數。我會在會話期間記錄開始日期,結束日期以及基本上一些計數器(例如點擊次數)。這是每秒約8000插入。
我雖然關於Hadoop,因爲RDBMS顯然不會很容易擴展(如果你說服我,PostgreSQL可以在5000-8000美元的機器上處理這個負載)將會使用PostgreSQL。
但是,我讀過Hadoop具有太多延遲,因爲它是面向批處理的,所以它可能不適合分析。你怎麼看 ?
網絡營銷行業用於提供數據庫和查詢的解決方案是什麼?
謝謝!
石墨看起來不錯,但不適合分析材料(過濾器/連接...)。無論如何感謝您指出! – SCO