2013-10-04 30 views
0

好吧,讓我們試着更詳細地解釋這一點。 我正在開發飛機診斷系統。假設飛機有6到8臺車載電腦。每臺計算機有超過200個不同的參數。診斷系統以二進制格式包接收所有這些參數,然後根據公式(到km,km/h,rpm,min,sec,pascals等)傳輸數據並將其以某種方式存儲在數據庫中。新數據必須每10-20秒處理一次並再次存儲在持久性中。 我們存儲數據以進一步分析處理。什麼是存儲高度參數化實體的最佳方式?

存儲的要求:

  • 支持拆分和複製
  • 快讀:支持B樹索引
  • NOSQL
  • 快寫

所以,我計算的平均每臺平面磁盤或RAM使用量。這是大約10 - 20 MB的數據。所以估計的負載是每天100架飛機或每天2GB的數據。

似乎要將所有數據存儲在RAM(memcached-liked存儲:redis,membase)中並不合適(太昂貴)。但是,現在我正在尋找到mongodb方面。由於它可以用作RAM和磁盤使用,它支持所有需求。

請分享您的經驗和建議。

+0

你想用什麼工具分析數據?如果是OLAP,那麼就需要一個傳統的SQL接口。可以針對HBase或Hadoop使用Hive。針對mongo需要map-reduce。 –

+0

謝謝@NeilMcGuigan的貢獻。對於分析,我希望使用[storm](https://github.com/nathanmarz/storm)(基於java)處理預彙總數據。由於它易於分佈並保證可用性。你怎麼看 ?請你更具體一些,請!我需要更多的細節,可能是你已經涉及的用例。 –

+0

您需要存儲數據多長時間(因爲實時分析)? 你需要隨機讀取能力嗎? 只需將數據放入HDFS(Hadoop文件系統)即可。 –

回答

相關問題