我知道Spark Spark使用微量批處理數據,但在某些情況下,處理時間不到一秒鐘。我的問題是「不能把它稱爲純實時處理,而不是在那個實驗室裏進行實時處理?」爲什麼火花流被稱爲接近實時?
0
A
回答
1
我想說,我們只能在收集數據並將其直接推送到儀表板或系統時進行實時指標,警報和優化,而無需任何ETL過程,實時目的是,主要是速度。
每當有批次的流程提取歷史趨勢或基準時,儘管時間不到一秒,但不是實時的,而是接近它,這是因爲他們談論的是接近實時的。
所以,要回答你的問題,我會說不,因爲你正在進行配料和加工,所以接近實時。
我希望它有幫助。
涓
1
火花流將所述數據流分成的X秒批次稱爲Dstreams,其內部是RDDS,一個用於每批間隔的序列。每個RDD都包含在批處理間隔期間收到的記錄,因爲其小批量處理過程幾乎不實時。
+0
謝謝@vaquarkhan – dalonlobo
相關問題
- 1. 爲什麼火花
- 2. 什麼是在火花流
- 3. 爲什麼我只能看到一個火花流kafkaReceiver
- 4. 爲什麼火花擊殺任務?
- 5. 什麼時候gc被稱爲
- 6. 火花流
- 7. 火花流update_state_by_keys
- 8. 火花流
- 9. 爲什麼jQuery被稱爲jQuery?名稱的原因是什麼?
- 10. 爲什麼運行簡單的火花流很難?火花1.1.1 Maven依賴關係
- 11. 爲什麼argsort被稱爲argsort?
- 12. 爲什麼SP-Initiated被稱爲SSO?
- 13. 爲什麼cookies被稱爲「cookies」?
- 14. 爲什麼密碼鹽被稱爲「鹽」?
- 15. 爲什麼Method#arity被稱爲「arity」?
- 16. 爲什麼cc1被稱爲cc1?
- 17. 爲什麼AJAX被稱爲異步?
- 18. 爲什麼Common Table Expression被稱爲「Common」?
- 19. 爲什麼mojolicious行動不被稱爲?
- 20. 爲什麼9patch被稱爲9patch
- 21. 爲什麼'Select'被稱爲DML語句?
- 22. 火花爲什麼列更改爲可空
- 23. 更接近HTML ...那麼爲什麼HtmlHelper?
- 24. Silverlight:爲什麼XAP被稱爲XAP,爲什麼不是其他?
- 25. 火花流聚合
- 26. 使用火花流
- 27. 使用火花流
- 28. 火花流文件流
- 29. 火花流功能通過異常火花提交時間
- 30. 火花 - 爲什麼火花工作持續時間不等於每個階段持續時間的總和?
謝謝@Juan,它清除了疑問 – dalonlobo
我剛剛問過我們的大數據專家(他在我的右側工作),他說大數據Spark Streaming被認爲是近實時的,因爲他的精度接近於毫秒以及Storm等框架或新的Spark(結構化流媒體),您可以以毫微秒的精度工作,這是大數據中的純粹主義者所稱的實時。 – Juan