我想使用HBase作爲商店,我可以推送格式爲{document => {term => weight}}
的數百萬條目,例如「將詞語X插入到具有重量Z的文檔Y中」,然後發出諸如「爲該文檔選擇前1000條款」或「爲每個文檔選擇前1000條款」的命令。這適用於我當前的MySQL實現,但也許該域更適合HBase。我注意到HBase和BigTable用於全文索引,這是一個類似的問題域。這是一個合適的(或可能的)HBase的用法嗎?
你可以告訴我,我已經不只是閱讀HBase上的幾頁了,但我希望你能理解我的問題的要點。這與this question有關。
可能的障礙可能包括HBase不允許使用與LIMIT
子句等價的查詢。鑑於我想查詢重量,我想聯想{weight => term}
,這將是兩個具有相同權重(我假設HBase只允許唯一鍵)的術語有問題。或者,我將不得不爲一個給定重量存儲一組條款,但這會限制我準確限制退貨條款數量的能力。