我知道在該主題中提出了類似的問題,但我仍然沒有看到任何完全包含我所有請求的人。NoSQL或RDBMS用於審計數據
我會開始說我只有RDBMS的經驗,所以我很抱歉,如果我得到關於NoSQL的任何錯誤。
我正在創建一個可以容納大量審計日誌(大約1TB)的數據庫。
我使用它:
快速數據寫入(審計日誌的巨量寫入所有的時間)
搜索 - 進行了審計數據搜索(搜索行動由某個用戶在某個時間或某個動作...數據庫應支持搜索任何'列'非常快)
分析&報告 - 生成每日,每週,每月報告數據(這些都在一瞬間預定義。如果他們更有活力,它影響的解決方案,我應該選擇?)
可靠性,可擴展性(故障切換,或任何類似的功能支持)(如果我增長到1TB以上到2TB,10TB或100TB - 是否有任何解決方案不能支持這一數據量?),當然性能(在我指定的用例中)對我來說非常重要。
我知道RDBMS,這將是我開始的簡單方法,但我真的擔心,過了一段時間,數據庫根本無法跟上節奏。
我的問題是我應該選擇一個RDBMS或NoSQL解決方案,爲什麼?如果NoSQL解決方案因爲它們如此不同,您認爲哪些解決方案符合我的需求?
謝謝。我真正想要理解的一件事是讓我們說我擁有1000萬行NoSQL。我是否需要技巧和指數等來快速處理查詢(秒)?由於我在該領域沒有太多經驗,我不確定MapReduce和其他NoSQL解決方案的速度規模如何。你能詳細說明一下嗎?我知道這是一個相當普遍的問題,但我一般都想了解NoSQL中的數量和查詢速度......謝謝! – 2013-03-15 07:39:17
這將取決於您使用的解決方案。列存儲方法很容易處理10M行,但大多數RDBMS也是如此。您從查詢中獲得的速度更多受數據類型,索引,查詢方式以及整體IO /內存帶寬的影響。有關RDBMS基準測試,請參閱http://www.networkworld.com/news/tech/2012/102212-nosql-263595.html和http://www.tpc.org – rlb 2013-03-15 09:53:21