2012-09-18 133 views
3

我有一個任務,調查使用哈桑與卡桑德拉。卡桑德拉與Haddop

Hadoop的namenode是單點故障。這意味着如果namenode出現故障,整個數據庫都無法訪問。所有Cassandra節點都是相同的,所以沒有單點故障。

如果我在Cassandra中使用Hadoop,我假設所有系統都有單點故障(據我所知Hadoop namenode)。

我的問題:

1-是我以前的假設是真的嗎?

2-如果是這種情況,使用這種結構(Cassandra和Haddop)有什麼優勢嗎?

回答

4

它的一半是事實。如果您將Cassandra與Hadoop一起使用,則所有數據都將存儲在Cassandra而不是HDFS中,並且正在使用Hadoop進行計算。因此,如果您的namenode出現故障,您唯一失去的就是運行地圖縮減任務的能力,但您的所有數據都將安全無虞。

+0

而DataStax Enterprise(http://www.datastax.com/products/enterprise)使您能夠將作業信息和其他Blob數據存儲在CassandraFS而不是HDFS中(http://www.datastax.com/resources/whitepapers/hdfs-vs-cfs),所以根本沒有Namenode依賴。 – jbellis