我正在尋找一種簡單的方式來存儲和檢索數百萬個xml文件。目前,所有事情都是在文件系統中完成的,這有一些性能問題。對於簡單和高性能的文件存儲,Bitcask可以嗎?
我們的要求是:存儲數百萬的XML的文件在一個批處理
- 能力。 XML文件可能高達幾兆,大部分在100KB範圍內。
- 非常快速隨機查找的ID(如文檔的URL)
- 允許訪問的Java和Perl中的最重要的Linux發行版
- 可用和Windows
我看看幾個的NoSQL -Platforms(如CouchDB的,Riak等),同時這些系統很好看,他們似乎就像矯枉過正beeing:
- 沒有聚類所需
- 沒有守護進程(「服務」)要求
- 沒有聰明的搜索功能所需
已經深入研究深入到了Riak,我發現Bitcask(見intro),這似乎是我想要的東西。介紹中介紹的基礎知識非常有趣。但遺憾的是訪問通過Java一bitcask回購絕非(或者是那裏?)
洙我的問題歸結爲
- 在下面的假設是正確的:Bitcask模型(追加,只寫,內存中的密鑰管理)是存儲/檢索數百萬個文檔的正確方式
- 是否有任何通過Java可用的Bitcask的替代方案? (BerkleyDB想起來......)
- (對於riak專家)Riak與「裸體」Bitcask相比,Riak有很多開銷實施/管理/資源方面的明智嗎?
對於矯枉過正。如果它們使用簡單,並且可以嵌入,它們也可以很適合......可做得越多越能做得更少。 – 2011-05-15 13:46:22