2009-11-05 77 views
2

我想使用HBase作爲商店,我可以推送格式爲{document => {term => weight}}的數百萬條目,例如「將詞語X插入到具有重量Z的文檔Y中」,然後發出諸如「爲該文檔選擇前1000條款」或「爲每個文檔選擇前1000條款」的命令。這適用於我當前的MySQL實現,但也許該域更適合HBase。我注意到HBase和BigTable用於全文索引,這是一個類似的問題域。這是一個合適的(或可能的)HBase的用法嗎?

你可以告訴我,我已經不只是閱讀HBase上的幾頁了,但我希望你能理解我的問題的要點。這與this question有關。

可能的障礙可能包括HBase不允許使用與LIMIT子句等價的查詢。鑑於我想查詢重量,我想聯想{weight => term},這將是兩個具有相同權重(我假設HBase只允許唯一鍵)的術語有問題。或者,我將不得不爲一個給定重量存儲一組條款,但這會限制我準確限制退貨條款數量的能力。

回答

0

簡單的回答是的。

更復雜的答案,現在這些「沒有sql」數據存儲每個實現他們自己的程序員接口,而「無sql」意味着他們不是基於SQL的。因此,準備一些編碼,但沒有困難。大多數這些數據存儲都是名稱值對存儲,通過REST或SOAP獲取(HBase也有列家族的概念)。他們所做的是Map Reduce,這是一個非常有趣的查詢領域,值得一讀。

相關問題