2012-08-07 138 views
4

集成Cassandra和Hive的最佳實踐是什麼?Cassandra - Hive集成

Stackoverflow上的一個老問題(Cassandra wih Hive)指向了Brisk,它現在已經成爲僅限訂閱的Datastax Enterprise產品。

谷歌搜索僅指向兩個開放JIRA問題,

,但它們都沒有導致致力在兩個項目之一的任何代碼。

將Cassandra和Hive修補Cassandra/Hive源代碼的唯一方法是整合Cassandra和Hive嗎?你在堆棧中使用哪種解決方案?

回答

1

我在一個月前做了同樣的研究,得出了同樣的結論。 Brisk不再可用作社區下載,除了修補Cassandra/Hive代碼之外,在Cassandra數據庫中拋出map/reduce作業的唯一方法是使用DSE - Datastax Enterprise,我相信這是免費使用的但生產集羣。

你可能會看看HBase這是基於HDFS

-1

您可以針對此問題使用集成框架或集成套件。查看我的演示文稿「Big Data beyond Hadoop - How to integrate ALL your data」,瞭解有關如何使用Hadoop開源集成框架和集成套件的更多信息。例如,Apache Camel(集成框架)和Talend Open Studio for Big Data(集成套件)是兩種開源解決方案,它們提供Cassandra和Hadoop的連接器。