2012-07-16 124 views
1

在我工作的應用程序中,我需要搜索數據庫中的文本(全文搜索)並根據其他列優先搜索結果。考慮性能,哪種數據存儲最適合這裏?我需要搜索結構化數據並確定結果的優先級。在數據庫中搜索結構化數據(全文+查詢)

它是RDBMS還是文檔存儲(Couch,Mongo)或任何其他NoSQL數據庫?還是應該使用Hadoop等批處理工具並準備搜索數據?

我正在尋找路線。提前致謝。

回答

1

一個月前,我有一個類似的問題,想知道是否有確鑿的事實,對nosql解決方案的性能好處負責任的措施。

所以我用Google進行比較,發現這個neat test,這是pierre-yves在幾天前做的。底線:文件存儲在性能方面似乎佔據了領先地位,但與往常一樣,nosql解決方案必須牢記這一點。

更新: 我忘了提及的是:皮埃爾也討論了區分大小寫的區別。一個討論我不能完全遵循全文搜索,因爲在全文搜索中,你幾乎總是希望不區分大小寫的搜索。也許你正在搜索的詞語在大寫字母中被標記爲重要的(帶有小字母!),並且你不會以敏感的方式發現它們。