2010-08-09 93 views
4

我一直在玩apache的cassandra項目。完成了一些readin,並且我已經完成了一些相當複雜的示例,包括插入單個和批量數據集,基於鍵檢索單個和多個數據集。 一些我看過的文章包括apache cassandra查詢/全文搜索

http://www.rackspacecloud.com/blog/2010/05/12/cassandra-by-example http://github.com/digg/lazyboy http://arin.me/blog/wtf-is-a-supercolumn-cassandra-data-model http://www.sodeso.nl/?p=80

我已經得到的概念相當把握好解釋,並甚至實現了一個簡單的應用程序。

的文章都沒有描述一個將如何去進行查詢,其中對於例如,查詢搜索項中的用戶已鍵入。

有誰知道如何或可以建議我怎麼會去關於執行這樣的查詢? 或者可能是一種創建可搜索索引,全文搜索或甚至遠程關閉的任何方法?

回答

3

您可能會將文本拆分爲單詞,而不是將這些單詞用作「索引」的鍵。每個單詞將包含時間戳排序列家族和ID列表到您的文章,消息等。所以你只能執行簡單的搜索關鍵(單詞)。 當搜索多個單詞時,請使用這些列系列的交叉點。

這是非常簡單的方法,如果您需要更復雜的查詢看看Lucandra - http://github.com/tjake/Lucandra - Lucandra是一個全文搜索引擎,Cassandra作爲後端存儲。