我已經用C寫的履帶++,我期待一個分佈式數據存儲庫,我發現2 1)HBase的 2)Hypertable的爲什麼我們需要的Hadoop爲Hypertable的
都是大桌子和我的實現只是審查hypertable ..因爲它是在C++和..hbase中實施最廣泛使用 我的問題是我們需要hadoop的方式......如果我在hadoop上運行hypertable,是否有任何好處?
我已經用C寫的履帶++,我期待一個分佈式數據存儲庫,我發現2 1)HBase的 2)Hypertable的爲什麼我們需要的Hadoop爲Hypertable的
都是大桌子和我的實現只是審查hypertable ..因爲它是在C++和..hbase中實施最廣泛使用 我的問題是我們需要hadoop的方式......如果我在hadoop上運行hypertable,是否有任何好處?
不需要使用Hadoop。 Hypertable只需要在分佈式文件系統上運行。因此,您可以選擇Hadoop DFS,KosmosFS,GlusterFS,Ceph,也可以選擇其他一些(如MooseFS或Lustre)。
共同的好處取決於應用程序要求和現有的基礎設施。從故障排除的角度來看,社區(特別是Hadoop)的大小也是很重要的因素。
HyperTable也可以在普通的本地文件系統上運行。 –
在性能方面哪些更好的函數(在普通文件系統或hadoop上)? – ygaradon
您還可以查看cassandra(http://cassandra.apache.org/)與Big Table有點相似的另一個實現。
我認爲你的主要問題是: 就性能而言,哪裏的超級函數更好(在純文件系統上還是在hadoop上)? – ygaradon