2016-01-13 57 views
2

我一直在閱讀Hadoop,並且我已經閱讀了一些內容,Hadoop適用於離線計算。這是什麼意思「離線計算」?Hadoop離線計算含義

回答

2

術語「在線」和「離線」有時分別與術語「實時」和「批次」同義使用。例如,"online machine learning"指的是隨着新的訓練數據變得可用而持續發生的學習。相反,"offline machine learning"是指從一批訓練數據中學習。

Hadoop擅長批量處理大量數據(通常在相對不頻繁的情況下執行,例如每小時執行一次),而不是在數據變得可用時實時處理數據。

0

AFAIK,「離線計算」正是它所說的。這是一個與網絡斷開的系統(通常出於安全原因)。但它也與可以訪問本地數據庫的專用服務器有關,因此它們並不需要連接到網絡,也不需要浪費任何資源。

所以我認爲你讀過的文檔意味着Hadoop非常適合需要處理長時間運行的專用計算的專用服務器,而CPU是必須的。在這種情況下,「離線」通常與性能有關,而不是我猜測的安全性。

+0

作爲一個硬性規則數據庫從互聯網斷開安全原因?我不認爲這與定義有關? – DavidR

+0

我認爲曼索爾的解釋其實更清楚。 :-)但是「離線系統」這個術語通常與系統由於某種原因與網絡斷開連接。 – Leo

+1

我寧願使用術語「批處理」來代替 – Leo

1

on-line computing,用戶將等待他的查詢的響應,並期待real-timenear real-time中的響應。

offline computing中,用戶將在特定時間觸發/調度操作,並且不期望實時響應。操作完成後,他會在某段時間後檢查結果。

offline-computing將在大量數據上完成,這可能需要數小時才能完成,因此用戶對實時響應不感興趣。他會火&忘記計算操作。他將在他自己的時間檢查結果。