我有點困惑,我們如何將數據歸類爲大數據。如何確定大數據
難道確定數據是否是大的行數。假如我有100萬行數據在大數據類別中分類嗎?
,或者它實際上是確定它是否是大數據的數據大小。例如,GB的數據..等等?
其實,我們可以看到RDBMS的行數增長的性能下降。儘管數據的整體規模可能會更小。
我有點困惑,我們如何將數據歸類爲大數據。如何確定大數據
難道確定數據是否是大的行數。假如我有100萬行數據在大數據類別中分類嗎?
,或者它實際上是確定它是否是大數據的數據大小。例如,GB的數據..等等?
其實,我們可以看到RDBMS的行數增長的性能下降。儘管數據的整體規模可能會更小。
大數據具有以下特點; 1,非常大的,鬆散的結構化數據的分佈式聚合 - 往往是不完整和不可訪問:
2,拍字節/數據的艾字節
3百萬/十億人
4,十億/萬億記錄
5,鬆散的結構,往往分佈式數據
6,很少有複雜的扁平架構的相互關係
7,常涉及加時間戳的事件
8,通常由不完整的數據
9,通常包括必須概率推斷的數據元素之間的連接的,
10,所涉及的應用程序大數據可以是:
11,交易(例如,Facebook,PhotoBox),或者,
12,解析(例如,ClickFox,Merced的應用程序)。
更多定義引你可以從這裏Big Data
閱讀,顧名思義,大數據是數據量龐大。但只有數據的大小或數量不足以定義大數據。除了大數據的兩個主要參數是速度和各種。現在前來品種,在一天到一天的生活,我們在處理不同類型的像文字,圖片,音頻,視頻,博客等數據。通常,這些類型的數據稱爲無法使用關係數據庫存儲的非結構化數據。接下來的是速度。在捕獲大量數據的同時,我們必須處理的還有數據的速度。 Facebook,谷歌等每天都得到超過一個peta字節的數據。關係數據庫捕獲數據是不可能的。所以,我們稱之爲大數據。爲了捕獲大數據,我們避免使用關係數據庫。相反,我們使用一些NoSQL數據庫。
大數據不僅是你的數據集的大小,大約是大的處理能力了。 你可以有一個小的數據集,但如果你需要大的處理能力,那麼你可以利用大數據解決方案。
大數據是一個與大量數據共存的術語。現在,我們到處看到的唯一的數據可能是它來自何處: •信息技術 •事情 •零售行業 上網•醫療保健 •社交媒體 •智能手機 •機(傳感器,汽車,飛機,火車,地鐵等) •電子商務 •銀行部門
但問題出現在這裏,我們也從很久以前獲取數據,但爲什麼數據沒有轉換成大數據。我們擁有很長時間以來擁有的數據,但是如何將其轉換爲大數據。因爲我們剛纔討論的時候我們沒有這些技術。 幾年前,我們從未想過這些技術會發展。我們過去生活在一個非常簡單的世界,但現在我們可以看到任何地方的技術,以地鐵,飛機,智能手機和傳感器的形式,因此我們擁有大量的數據。
例如,在這個世界上,約98%的人擁有他們的Gmail帳戶和Facebook帳戶。
所以,只是說例如我有10個Gmail帳戶。現在我需要在一天內登錄到這些帳戶1次,所以10 * 1 =我已登錄的10次。
在這種情況下,當任何人只是登錄到他們的Gmail帳戶,我們生成一個日誌文件。日誌文件包含您的完整信息,如 - 系統的IP,MAC,服務提供商,位置 - 所有內容均存儲在日誌文件中。
只是做一個小小的計算:
世界人口截至目前= 7十億 至少98%或90%的人有一個Gmail帳戶 - 約。 (6.3億* 1)=我們在一天內從谷歌產生的63億個日誌文件,以及Facebook,Twitter和YouTube的情況。
因此,在這種情況下,我們不斷產生大量數據,所以現在數據已經成爲一個大數據。
一些因素大數據項共涉及類似
如果您只能處理MB的數據,那麼您的GB數據就是大數據。如果您只能處理GB數據,那麼您的數據TB就是大數據。 – displayName