2013-08-05 86 views

回答

5

只是爲了存儲,你可以在HDFS中存儲任何東西。但這沒有任何意義。首先,您不應該將Hadoop視爲RDBMS的替代品(您正在嘗試在此處進行此操作)。兩者都用於完全不同的目的。 Hadoop不適合您的交易,關係或實時類型的需求。它旨在滿足您的脫機批處理需求。因此,最好分析你的用例,然後凍結你的決定。

作爲一個建議,我想指出你Hive。它爲您現有的Hadoop集羣提供倉儲功能。它還爲您的倉庫提供了一個類似於SQL的界面,如果您來自SQL背景,這將使您的生活更加輕鬆。但是,Hive同樣也是一個批處理系統,如果你需要實時的東西,它並不適合。

雖然你可以看看HBase,正如abhinav所建議的那樣。這是一個可以在Hadoop集羣上運行的數據庫,併爲您提供對數據的隨機實時讀/寫訪問。但是你應該記住一件事,那就是NoSQL db。它不遵循SQL術語和約定。所以,你最初可能會覺得它有點陌生。與RDBMS的行式存儲不同,您可能不得不考慮如何以新的存儲風格(列式)存儲數據的問題。否則,設置和使用它不是問題。

HTH

0

任何文件都可以存儲在HDFS中。但是,如果你想要一個SQL類型的數據庫,你應該去HBASE。如果您直接將數據存儲到HDFS中,您將無法存儲合理性。

+1

您應該添加如何將關係數據存儲到像HBase這樣的柱狀存儲。 –

相關問題