短版方法設置
我想的對象在我的數據庫任意一組內有效地進行全文搜索。所有對象都將在搜索引擎中編入索引。
我的想法
我打算使之成爲一條部分操作。首先,搜索引擎將被查詢與全文搜索相匹配的加權/排序的一組ID。這組ID將被過濾,刪除不在用戶原始集合中的任何ID。
有沒有更好的方法來做到這一點?如果不是,你能否提供任何有效的建議?
龍版
我在構建Web應用程序,允許用戶可視化組高度關聯數據和操作這些可視化來獲得組有趣的頂點作進一步的分析規劃階段。用戶通過gui執行的過濾操作將非常複雜並且很難表示爲可索引的數量。
我想允許用戶在這些數據集中執行全文搜索。通過查看what Google does for searching within a result set,他們將較早的搜索查詢簡單附加到新查詢以啓用「搜索範圍內」可能對我的數據不可行。
對this question的接受答案促進了使用數據庫操作過濾來自搜索引擎的結果的想法。
作爲解決方案的一部分,我也在考慮在用戶想要搜索的頂點集足夠小以供前端處理時使用lunr作爲前端切換。弄清楚這個限制會需要一些測試,但我懷疑它會有幾千個,所以對服務器端解決方案的需求依然存在。
環境細節
我AppEngine上運行的Python 2.7。
在這個應用程序中,我期望初始結果集(將在內搜索)包含10到2000個頂點。整個數據庫中的頂點總數可能會增加幾個數量級。
哈哈在Southpark參考。但我承諾,這不適用於分析。 此外,它看起來像BigQuery是隻讀的,所以這不適合我。數據不會經常更改,但需要更改。儘管如此,緩存中間值以更快地解決關鍵查詢的想法可能是我可以使用的。 – turtlemonvh
現在我想到了,儘管這不是直接的分析,但它確實具有這種味道。 @ stevep的建議答案提醒您[儀表如何使用mongodb進行分析](http://www.10gen.com/presentations/mongodb-analytics)。 – turtlemonvh