2016-06-17 39 views
0

在假設的情況下,全球有數百臺機器。 所有這些都生成家政數據,日誌,記錄24x7。 該數據的一種可能用途是生成各種報告。大型固定格式數據可以用作大數據嗎?

整個生成的這些數據都是固定格式的,並且可以很好地使用相應的關係模式進行定義。

僅僅因爲它的巨大程度,它是否適合作爲大數據呢?

如何選擇關係型還是NoSQL解決方案來解決這類問題?

提出這個問題的理由是;當我們移出SQL /查詢域時,速度問題開始出現。

有沒有一種已知的做法來有效地處理這種數據?

回答

1

維基百科定義大數據爲「大數據是數據集的術語,因爲數據集太大或太複雜以至於傳統數據處理應用程序不足」。大概有數十種定義大數據 - http://www.forbes.com/sites/gilpress/2014/09/03/12-big-data-definitions-whats-yours,所以我建議你不要打擾這個詞本身,而是尋找你的問題的解決方案。

選擇NoSQL/BigData解決方案 - 「馬匹課程」沒有銀彈。要開始,看一看由Altoros的[R & d工程師做了以下研究 - 「NoSQL數據庫的獨立於供應商的比較:卡珊德拉,HBase的,MongoDB的,了Riak 與碎片化的MySQL」 - http://www.altoros.com/vendor_independent_comparison_of_nosql_databases.html。他們使用「雅虎雲服務基準」來對各種NoSQL進行基準測試。

相關問題