2011-08-16 48 views
2

有人可以突出顯示Hector批處理突變的優缺點,並使用Hadoop作業將數據加載到Cassandra中嗎?Hector的批次突變vs.使用Hadoop作業將數據加載到Cassandra?

我知道赫克託,你可以做類似如下:

mutator.addInsertion(...); 
mutator.execute(); 

而且在Hadoop中,您可以使用MR作業將數據加載到卡桑德拉。

我正在尋找使用或不使用他們每個人的原因。謝謝!

回答

2

如果數據源當前不在hadoop(或hbase)中,我會推薦一個使用上面的Mutator的多線程加載程序來減少運動部件的數量。

這個主旨過時,但是這種方法有異曲同工之處: https://gist.github.com/397574

讓我知道,如果你想了解更多詳細信息。

+0

謝謝zznate。我一定會喜歡它的更多細節。現在,我只是使用直接mutator.addInsertion()來加載CSV。如果你有它,我希望看到一個多線程的代碼段。我考慮使用hadoop工作的原因是因爲我曾看過[mumakil](https://github.com/Ganglion/mumakil/blob/master/src/mumakil/load/LoadTable.java)。但是這個解決方案似乎更復雜一點,就是普通的變種。 – max

相關問題