2015-04-24 92 views
0

在我的應用程序的所有實時數據在卡桑德拉表中存儲,我有計劃使用Apache火花來分析它,並把它分成不同的表,它允許更快的數據讀取,我想知道我需要申請哪種設計方法。卡桑德拉和Apache火花DB設計達到datewise過濾

分析relatime表的時限,再放入到每小時,然後分析後使其每日,每週再等等,那麼很容易在一個時間範圍內實現數據。我的邏輯是好還是用卡桑德拉和火花的其他方法?

+0

不知道您的要求是什麼,建議任何解決方案都非常困難。有許多不同的選擇可以做同樣的工作。 – maasg

+0

@maasg我的目的是收集來自客戶端應用程序的數據,並將其存儲在cassandra中,而無需修改。我將其稱爲實時數據,我們可以預計每秒100個記錄。需要顯示在儀表板上,需要過濾,需要顯示不同的日期範圍,需要更改狀態,需要靜音檔案等。如果你能提出所有的選擇,我會檢查它。 – Abdul

+0

他們在這裏做類似的事情:https://github.com/killrweather/killrweather如果你有更具體的問題會更好。設計建議主要是關於SO的觀點和實際上的主題。 – maasg

回答

1

我認爲你的方法很好。它類似於由Nathan Marz設計的Lambda Architecture。欲瞭解更多信息,請按照這link。希望這會幫助你。

+0

我不確定簡單的累計計算如何與lambda體系結構相關。 – maasg