Hector的批次突變vs.使用Hadoop作業將數據加載到Cassandra？

有人可以突出顯示Hector批處理突變的優缺點，並使用Hadoop作業將數據加載到Cassandra中嗎？Hector的批次突變vs.使用Hadoop作業將數據加載到Cassandra？

我知道赫克託，你可以做類似如下：

mutator.addInsertion(...); 
mutator.execute();

而且在Hadoop中，您可以使用MR作業將數據加載到卡桑德拉。

我正在尋找使用或不使用他們每個人的原因。謝謝！

來源

2011-08-16 max

如果數據源當前不在hadoop（或hbase）中，我會推薦一個使用上面的Mutator的多線程加載程序來減少運動部件的數量。

這個主旨過時，但是這種方法有異曲同工之處： https://gist.github.com/397574

讓我知道，如果你想了解更多詳細信息。

來源

2011-08-16 19:14:18 zznate

謝謝zznate。我一定會喜歡它的更多細節。現在，我只是使用直接mutator.addInsertion（）來加載CSV。如果你有它，我希望看到一個多線程的代碼段。我考慮使用hadoop工作的原因是因爲我曾看過[mumakil]（https://github.com/Ganglion/mumakil/blob/master/src/mumakil/load/LoadTable.java）。但是這個解決方案似乎更復雜一點，就是普通的變種。 – max

Hector的批次突變vs.使用Hadoop作業將數據加載到Cassandra？

回答

相關問題