我讀大數據和Hadoop教程,我發現在HDFS這2點低延遲的數據訪問,Hadoop的
流數據訪問:的時間來閱讀整個數據集更重要而不是閱讀第一個的潛伏期。 HDFS基於一次寫入和多次讀取模式。
&
低延遲數據訪問:的應用程序需要很短的時間來訪問的第一個數據不應該使用HDFS,因爲它給予,而不是時間來獲取第一重視整個數據記錄。
我很困惑,因爲第一次一個人說的時間來閱讀整個數據集,更重要的和第二個說:...不應該使用HDFS,因爲它是給予整個數據
重要性我不明白什麼是預期的?我是Hadoop的新手。