我打算做一個項目來實現HBase中的所有聚合操作。但我不知道它的困難。我只有6個月的時間來完成這個項目。我應該繼續嗎?我打算用java來做。我知道已經有一些聚合函數。但是現在沒有INNER JOIN像查詢那樣。我打算實施這種類型的查詢。我不知道這是一個錯誤或虛張聲勢。HBase內部加入和協處理器
0
A
回答
0
HBase肯定比在RDBMS或像PIG或Hive這樣的其他Hadoop技術中做得更難。
1
我想技術上我們應該區分兩種類型的連接:
a)一個小表+一個大表。小表我的意思是表可以緩存在每個節點的內存中,而不會嚴重影響集羣操作。在這種情況下,應該可以通過在散列映射中放置小表來實現使用協處理器的連接,迭代大表的數據的節點本地部分,並且以這種方式產生連接結果。在Hive的術語中,它被稱爲「地圖」加入http://www.facebook.com/note.php?note_id=470667928919。
b)兩張大桌子。我認爲在短時間內獲得產品質量並不可行。我可能會說,這樣的功能是MPP數據庫的領域,也是他們IP的重要組成部分。
相關問題
- 1. HBase的InternalScanner和過濾協處理器
- 2. 如何協處理器部署到CDH4 HBase的集羣
- 3. thrift hbase客戶端 - 支持過濾器和協處理器
- 4. 協處理器部署:更換jar而不重啓hbase會生效嗎?
- 5. 如何在hbase協處理器中攔截掃描
- 6. 如何使用hbase協處理器來實現groupby?
- 7. Aerospike是否有類似HBase的協處理器?
- 8. HBase 0.92是否支持協處理器二級索引?
- 9. 內存映射協處理器接口
- 10. 外部協議處理程序和現代瀏覽器
- 11. android內部和內存/處理器的限制?
- 12. MySQL內部加入內部加入?
- 13. 處理ISR內部的協議,以避免原子性
- 14. XMLHttpRequest的內部`onbeforeunload`處理器在Opera
- 15. 協會,加入和示波器
- 16. 來自intel的Xeon處理器的協處理器架構
- 17. 內部多處理池處理超時
- 18. 處理阻力和觸摸內部onTouch
- 19. 外部和內部SQL加入
- 20. 錯誤:協處理器超出範圍偏移部分解決]
- 21. 獲取TypeElement的內部名稱和註解處理器
- 22. 使用perl處理404和內部服務器錯誤WWW :: Mechanize
- 23. 錯誤org.apache.pig.tools.grunt.Grunt - 錯誤2998:未處理的內部錯誤。 org/apache/hadoop/hbase/filter/WritableByteArrayComparable
- 24. .NET批處理內部?
- 25. Python內部錯誤處理
- 26. 處理是內部的SQL
- 27. 內部處理程序IntentService
- 28. XSLT:處理內部XML
- 29. Eclipse內容協助在處理程序內部不起作用/ onclick
- 30. 協助我的批處理計算器