我需要存儲大量的小數據對象(每月數百萬行)。一旦他們得救,他們就不會改變。我需要:免費數據倉庫 - Infobright,Hadoop/Hive還是什麼?
- 將它們存儲安全
- 用它們來分析(主要是面向時間)
- 檢索某些原始數據偶爾
- 這將是很好,如果可以用的JasperReports或BIRT使用
我的第一個鏡頭是Infobright的社區 - 只是一個立柱導向,只讀存儲機制對MySQL
另一方面,人們說NoSQL方法可能會更好。 Hadoop + Hive看上去很不錯,但文檔看起來很差,版本號小於1.0。
我聽說Hypertable的,Pentaho的,MongoDB的....
你有什麼建議?
(是的,我在這裏找到了一些話題,但它是一年或兩年以前)
編輯: 其他解決方案:MonetDB,InfiniDB,LucidDB - 你有什麼感想?
版本號並不重要。 HDFS/Hadoop工作得很好 - 但如果您有多個節點進行數據和分析,它們只會很有趣。 – Leonidas 2010-03-11 09:11:02
如果你想快速入門,我建議使用pentaho和數據庫pentaho支持。我認爲下面的答案更側重於數據訪問,但在數據倉庫開發中,工具也很重要。 – elprup 2012-08-15 06:57:37
@Piotr:這是一個兩歲的問題,沒有答案。我需要一個與您的規格幾乎相同的解決方案。最後你決定使用什麼? – 2013-02-19 10:09:30