0
A
回答
1
你應該閱讀的最基本的Hadoop文檔開始:http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F
然後,你可以找到每個項目工地的最好的解釋:
Apache的豬是用於分析大數據集的平臺它包含用於表達數據分析程序的高級語言,以及用於評估這些程序的基礎設施。 Pig程序的顯着特點是它們的結構適合於大量的並行化,這又使得它們能夠處理非常大的數據集。
Apache的蜂巢™數據倉庫軟件便於查詢和管理駐留在分佈式存儲大型數據集。 Hive提供了一種機制來將結構投影到這些數據上,並使用一種名爲HiveQL的類似SQL的語言來查詢數據。同時,這種語言還允許傳統的map/reduce程序員在HiveQL中表示這種邏輯不方便或效率低時插入自定義映射器和reducers。
使用Apache HBase的,當你需要你的大數據的隨機,實時讀/寫訪問。該項目的目標是託管非常大的表 - 數十億行×數百萬列 - 在商品硬件集羣上。 Apache HBase是一個開源的,分佈式的,版本化的非關係數據庫,其模型是由Chang等人在Google的Bigtable:一種用於結構化數據的分佈式存儲系統之後建模的。就像Bigtable利用Google文件系統提供的分佈式數據存儲一樣,Apache HBase在Hadoop和HDFS之上提供了類似Bigtable的功能。
相關問題
- 1. Hadoop,Hive,Pig,HBase,Cassandra - 什麼時候用?
- 2. 如何使用Pig加載數據在hbase中使用Pig
- 3. PIG - Hbase - RowKeyDistributorByHashPrefix - DistributedScanner
- 4. 性能:Pig vs Hive
- 5. 如何統計Pig和Hive中的列中的不同值
- 6. 安裝Apache Pig,爲什麼我看到Hbase和Hive安裝?
- 7. PIG - HBASE - 鑄造值
- 8. Hive over HBase vs Hive over HDFS
- 9. 使用Hive與Pig
- 10. Pig BigDecimal to Hive十進制
- 11. SAS宏代碼到Pig/Hive
- 12. Elasticsearch線程的行爲彼此不同
- 13. 拉伸彼此之間不同的div
- 14. PIG不能理解hbase表格數據
- 15. Hbase和PIG不存儲所有行
- 16. 如何將Hive表映射到HBase中?
- 17. 使用pig更新Hbase表
- 18. PIG HBASE FAILED;商店CSV
- 19. 如何利用彼此
- 20. 如何讓div下彼此
- 21. Regexp錨點\ B和\ b是如何彼此不同的?
- 22. 如何合併兩個在git中彼此不同的分支
- 23. C#數組,如何使數組中的數據彼此不同?
- 24. 這些重載方法如何彼此不同?
- 25. RoutedCommand構造函數如何與彼此不同?
- 26. 如何從不同的行爲彼此對齊的視圖android
- 27. 這兩個指針如何彼此不同?
- 28. Pig如何處理非結構化數據,而Hive不能?
- 29. HBase Hive集成 - 錯誤
- 30. 在Hive中註冊Hbase表