首先,我對大數據和Hadoop世界比較陌生,並且我剛剛開始嘗試使用Hortonworks Sandbox(到目前爲止,Pig和Hive)。 我想知道在哪些情況下可以使用上述Hadoop,Hive,Pig,HBase和Cassandra工具?
Hadoop,Hive,Pig,HBase,Cassandra - 什麼時候用?
在我的沙箱環境中,只有9MB的文件Hive和Pig的響應時間爲幾分鐘到幾分鐘。這在某些情況下顯然不可用,例如Web應用程序(除非它是其他內容,例如我的虛擬機設置)。
我有關正確用法的猜測是:
- 的Hadoop:就剩下了技術基礎,它會直接使用只有極少數的使用情況
- 蜂巢或豬:在分析過程即每小時或每天一次運行
- HBase的或卡桑德拉:用於需要
附加100毫秒或更少的響應時間的實時應用(例如web應用)何時使用HBase而不是何時使用Cassandra?
謝謝!
我認爲Hadoop的意思是HDFS,因爲Hive,Pig和HBase主要使用HDFS作爲他們的文件系統。 –