談到MapReduce工作時,Cassandra優於HBase的優勢是什麼?Cassandra vs HBase for Hadoop工作
我有很多我想從HDFS移動到數據庫的小文件,並且這些文件將被輸入到MapReduce作業中。我不會把所有的文件,但對於某個用戶,所以可能整個行,至少一個列家庭。我可以從某個時間段拿檔案。
我知道HBase是的Hadoop數據庫,所以我期望能整合好我需要的東西,但是我也看到Cassandra有更好的性能。但是我想知道當您將它用作MapReduce作業的輸入時,情況如何。性能仍然比HBase更好嗎?
我必須強調一點,我並不是在尋找HBase和Cassandra的對比,而是在MapReduce作業的具體案例中。諸如this之類的問題不會具體談論MapReduce作業的性能。另外,我正在尋找新的信息(我提到的問題是從2011年起,我相信自那以後可能會有一些變化)。
謝謝您的建議,但該問題和答案可能有點過時(自2011年以來進行了多少更改?)。另外,我並不只對比較數據庫感興趣,但想知道哪些MapReduce作業具有更好的性能,並且沒有關於它的任何信息。 – Marko